JP3805005B2 - 画像処理装置及び光学的文字認識装置及びそれらの方法 - Google Patents

画像処理装置及び光学的文字認識装置及びそれらの方法 Download PDF

Info

Publication number
JP3805005B2
JP3805005B2 JP28153295A JP28153295A JP3805005B2 JP 3805005 B2 JP3805005 B2 JP 3805005B2 JP 28153295 A JP28153295 A JP 28153295A JP 28153295 A JP28153295 A JP 28153295A JP 3805005 B2 JP3805005 B2 JP 3805005B2
Authority
JP
Japan
Prior art keywords
character
vertical
vertical bars
horizontal
cutting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP28153295A
Other languages
English (en)
Other versions
JPH08293001A (ja
Inventor
ケイ ファング ハング
敏明 矢ヶ崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JPH08293001A publication Critical patent/JPH08293001A/ja
Application granted granted Critical
Publication of JP3805005B2 publication Critical patent/JP3805005B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、接触した文字を含む画像における独立した文字を切り出す画像処理装置及び光学的文字認識装置及びそれらの方法に関するものである。
【0002】
【従来の技術】
文字認識システムにおいては、文書の画像を生成するために、複数の文字で構成された文書をスキャンし、文書の画像は、独立した文字の画像を切り出すために区分して分析される。ここで、各々の文字画像は、一致するものを見つけるために予め設定された標準的なパターンと比較され、一致するものを見つけたときに文字の識別子が出力される。
【発明が解決しようとする課題】
独立した文字の画像を切り出すべく文書を区分して解析するための多くの技術が提案されている。これらの技術の殆どは、隣接する文字の画像の間の空間の存在に依存し、それ故に、これらの技術は、互いに接触した文字の画像の間を切断しない。その結果として、単一の文字の画像を比較する代わりに、接触した文字に関しては、2またはそれ以上の接触した文字が比較される。接触した文字と一致する予め設定された文字パターンが存在しない場合は、それらの接触した文字に関する認識は失敗する。
【0003】
例えば、タイプ印刷された文書のように、固定したピッチで構成された文字を有する文書においては、接触した文字は希であり、認識の精度も比較的高い。しかしながら、例えば、発行された特許、新聞、雑誌の如き植字した文書(type-set document)のように均整のとれた区間を有する文書に関しては、接触した文字は、より頻繁となり、それらの頻度は大文字の付近で高くなる。例えば、均整のとれた空間を有する文字列”LIFT”においては、通常”L”と”I”が接触し、”F”と”T”が接触する。従来の文字の切り出し技術は、このような接触した文字の間を切断することに失敗するため、均整のとれた空間を有する文字、特に大文字に関しての認識の精度は比較的低い。
【0004】
したがって、認識の精度を高めるためには、接触した文字の間を切断する切断技術が必要となる。
【0005】
接触した文字の間を切断する1つの切断技術は、入力文字データの投影した輪郭(projection contour)を生成し、その投影した輪郭におけるピーク数、ピークの高さ、ピークの広がり、ピークの幅、そのプロジェクションの輪郭における谷の深さ、その投影した輪郭から生成された平滑化した垂直方向の投影の曲線の対称性等のファクタに基づいて、入力文字データに存在する接触した文字の領域を決定する。そして、谷の関数(valley function)が、検知された接触した文字領域を切断する場所を決定するために使用される。この技術に関する1つの問題は、特定の文字の組合わせは、特定の文字から区別できないことである。例えば、文字の組合わせ”LI”についての投影した輪郭は、文字”U”についての投影した輪郭から区別することができない。その結果、文字の切断はなされず、それ故に、正しい文字認識を行うことができない。
【0006】
したがって、接触した文字を切断する技術、特に接触した大文字を切断する技術が必要となる。
【0007】
【課題を解決するための手段】
本発明は、上記の課題に鑑みてなされたものであり、接触した文字における垂直な線の一画の対の間の空間をクラス別けすることにより、接触した文字の間を切断する方法及び装置を含む文字認識システムを提供するものである。
【0008】
本発明は、少なくとも2つの接触した文字を含む文字画像データから独立した文字を切り出す画像処理方法及び装置に関する。本発明によれば、文字画像データにおける垂直バーの対が検出され、前記垂直バーの対の間に位置する複数の独立した水平バンドの夫々において、所定の画像データが存在するかどうかが確認され、前記所定の画像データを含むと確認された水平バンドに基づいて、前記垂直バーの対がクラス別けされ、そして、前記クラス別けに基づいて前記垂直バーの対の間を切断するか否かと、その切断の位置が決定される。
【0009】
前述の文字切断方法は、文字の幅には従わず、文字領域における垂直バーの対の間の空間のクラス別けに従って切断されるため、接触した文字の正確な切断が可能になり、過度の演算を実行することなく、尚且つ例えば”U”のような文字の中で間違って切断することなく、例えば”LI”のような接触した文字が切断される。さらに、前述の発明は、クラス別けの体系に従って文字領域を切断するため、文字の切断の誤りの頻度が減少する。
【0010】
本発明の好適な実施の態様に拠れば、本発明は、文字認識システムに係り、上記の文字切断技術の適用の前に、先ず、接触していない文字の間を切断する。その後、未認識の文字画像が接触した文字の画像であるとの過程の下に、上記の切断技術がその未認識の文字画像に適用される。もし必要であれば、接触した文字に関する他の切断技術を適用しても良い。そして、未認識の文字に切断技術を適用する処理を、全文字が正しく認識されるまで何回か繰り返しても良い。
【0011】
ここで説明した課題を解決するための手段は、発明の本質を即座に理解するためのものである。本発明は、以下の発明の実施の形態の説明と添付図面を参照することにより、さらに完全に理解される。
【0012】
【発明の実施の形態】
図1は、本発明の実施の形態に係る装置の外観を示す図である。図1に示されているのは、例えば米マイクロソフト社のウインドウズ等のウインドウ環境を有する米アップル社のMacIntoshまたはIBM社のPC互換のコンピュータ等のコンピュータ装置10である。コンピュータ装置10は、カラーモニタ等の表示画面12、次のデータやユーザの命令を入力するためのキーボード13、表示画面12上に表示されたオブジェクトをポインティングしたり、操作したりするためのマウス等のポインティングデバイス14を備えている。
【0013】
コンピュータ装置10は、コンピュータディスク11のような大容量記憶装置を備えており、この大容量記憶装置は、文書の画像データ、テキストデータファイル、その他の圧縮或いは伸張された形態のデータファイル、文字認識プログラム、文書処理或いはスプレッドシート(spreadsheet)処理プログラム、その他の情報処理プログラム(コンピュータ10によって操作したり、ディスク11上に格納したり、オペレータに表示画面12を介してこれらのファイルのデータを提供したりするプログラム命令を含む)を格納することができる。
【0014】
画像データは、文書若しくはその他の画像をスキャンするスキャナ16によって入力され、これらの文書等のビットマップ画像をコンピュータ装置10に提供する。また、データは、ネットワークインターフェース24等の他の様々な資源や、ファクシミリ/モデムインターフェース26を介して他の外部装置からコンピュータ装置10に入力されることもある。
【0015】
図1には、プログラム可能な汎用のコンピュータ構成が示されているが、他の機器と接続して用いる、或いは単独で用いるコンピュータや、他のタイプのデータ処理装置にも本発明を提供可能なことは容易に認識される。
【0016】
図2は、コンピュータ装置10の内部構成を示す詳細なブロック図である。図2に示すように、コンピュータ装置10は、コンピュータバス21と接続された中央処理装置(CPU)20を有している。また、コンピュータバス21には、スキャナインターフェース22、ネットワークインターフェース24、ファクシミリ/モデムインターフェース26、ディスプレイインターフェース27、キーボードインターフェース28、マウスインターフェース29、メインメモリ30、ディスク11が接続されている。
【0017】
メインメモリ30は、文字切断プログラム、文字認識プログラム、文書及び情報処理プログラム、その他のアプリケーションプログラム等の格納されたプログラム命令を実行する際に、CPU20が使用するランダムアクセスメモリ領域を提供する。さらに具体的には、CPU20は、これらのプログラムをディスク11からメインメモリ30に読み込んで、メインメモリ30を用いて、これらの格納されたプログラムを実行する。
【0018】
図3は、本実施の形態の光学的文字認識システムの動作を示すフローチャートである。図3における処理の工程は、上記の如くディスク11上に格納されており、メインメモリ30を用いてCPU20によって実行される。
【0019】
ステップS301において、ユーザは、本実施の形態の光学的文字認識システムに画像データを入力する。画像データは、スキャナ16を用いて文書をスキャンすることを含む上記の手段によって入力される。また画像データとしては、テキストや写真等を含む様々な画像を適用することができる。
【0020】
ステップS302では、例えば、米国特許出願第08/171,720号に開示されたブロック選択技術を用いて入力画像データにおいてテキストブロックを識別する。上記米国出願の内容は、本出願の一部として取り込んでいる。ステップS303では、テキストブロックにおいて、テキストの独立した行を識別する。ステップS304では、テキストの1つの行内の文字を公知の空白切断方法に基づいて切り出す。すなわち、テキストの行における空白が識別され、その空白の位置に基づいてテキストの1つの行内の夫々の文字をその行から切り出す。ステップS305では、空白切断方法によって全文字が切断されたか否かを判断する。そして、全文字が切断された場合には、処理の流れはステップS319に進み、ここで入力画像データの光学的文字認識が終了する。一方、全文字が空白切断方法によって切り出されていない場合には、処理の流れはステップS306に進む。ステップS306では、ステップS311〜S317を10回繰り返す際に使用するフラグ(FLAG)を初期化する。次いで処理の流れはステップS307に進む。
【0021】
ステップS307では、切断された文字を識別すべく認識処理され、ステップS308では、認識が適切になされたことを補償するために認識の結果を確かめる。認識が適切になされたと判断された場合は、処理の流れはステップS309からステップS320に進み、ここで他の情報処理プログラムによる使用のためにテキストファイルに文字の識別子を格納し、処理の流れはステップS305に進む。文書中の全文字が処理されたことがステップS305において判断されると、処理の流れはステップS309からステップS310に進む。
【0022】
ステップS310では、ステップS311、S313、S315及びS317の文字切断ルーチンが文字領域を10回切断したか否かを判断する。そして、文字切断ルーチンが文字領域を10回切断したら、処理はステップS321に進み、更なる処理が更なる情報を発生しないことが決定される。そして、ステップS321では、エラーフラグをファイルに格納する。その後、処理の流れはステップS305に戻り、全ての文字画像に関して処理するまで動作を繰り返す。
【0023】
ステップS311、S313、S315及びS317の文字切断ルーチンが文字領域を10回切断した場合、処理はステップS311〜S317に進み、文字切断ルーチンの1つが文字領域を切断する。
【0024】
ステップS311では、本実施の形態の文字切断方法(クラス別け方法)が文字領域に適用される。この方法は、図4に詳細を示されている。ステップS312では、ステップS311において切断がなされたか否かを判断する。そして、ステップS311において切断がなされたと判断した場合には、処理はステップS318に進み、切断がなされたことを示すためにフラグをインクリメントする。一方、ステップS311において切断がなされなかった場合にはステップS313に進む。
【0025】
ステップS313では、公知の最も弱い接触点を持つ文字の切断方法(weakest touching point character cutting method;最弱接触点方法)が文字領域に適用される。この最も弱い接触点を持つ文字の切断方法は、文字領域において、文字領域の垂直のヒストグラムの垂直成分が最小の点で、2つの接触した文字の間を切断する。そして、切断がなされたと判断した場合は、処理の流れはステップS318に進み、切断がなされたことをしめすためにフラグをインクリメントする。一方、ステップS313において、切断がなされない場合には、処理はステップS315に進む。
【0026】
ステップS315では、公知の1個の接触点を持つ文字の切断方法(single touching point character cutting method;シングル接触点方法)が文字領域に適用される。この1個の接触点を持つ文字の切断方法は、文字領域において、垂直な線を横切る接触した文字における唯1つの点を含む垂直な線で、2つの接触した文字の間を切断する。例えば、”OO”のような接触した文字の組合わせにおいて、文字上の垂直な線を文字が接触する点で唯一つの点が横切る。したがって、切断は、その垂直な線に沿ってなされる。ステップS316では、ステップS315において切断がなされたと判断した場合は、処理の流れをステップS318に進め、切断がなされたことを示すためにフラグをインクリメントする。一方、ステップS315において切断がなされなかった場合には、処理の流れはステップS317に進む。
【0027】
ステップS317では、公知の文字分布の谷(valley-on-the-character-upper-profile)文字切断方法(若しくは谷文字切断方法)が文字領域に適用される。この谷文字切断方法は、接触した対の文字を谷関数によって決定した点で切断する処理であり、この処理の後、処理の流れはステップS318に進み、ここでフラグがインクリメントされる。
【0028】
本実施の形態は、本実施の形態において説明した文字切断ルーチンに限定されるものではない。すなわち、他の文字切断ルーチンを上記のルーチンに追加しても良いし、置換しても良いし、1または2以上の上記の公知の文字切断ルーチンを削除しても良い。
【0029】
ステップS318のおいてフラグがインクリメントされた後、処理の流れはステップS307に進み、ここで切断が認識される。上記の処理は、文字が10回切断され、それが認識されるまで、或いは文字が正しく認識されるまで繰り返され、その後、処理の流れはステップS321に進んでテキストファイルにエラーフラグが格納されるか、若しくはステップS320に進んで認識された文字が格納される。その後、処理の流れはステップS305に戻り、全ての文字の領域が認識されるまで一連の処理が繰り返される。
【0030】
図4(a)及び(b)は、ステップS311に係る本実施の形態の文字切断方法のフローチャートを示している。図4に示すフローチャートに拠れば、第1の垂直バーの対が文字の画像データから検出され、第1の垂直バーの対の間に位置する複数の独立した水平バンドの夫々における画像データの存在が確認される。第1の垂直バーの対は、画像データを含む水平バンドに基づいてクラス別けされ、そのクラス別けに基づいて、垂直バーの間で切断するか否か、及び切断する場所が決定される。図4のフローチャートに示される方法の各工程を以下に説明する。
【0031】
ステップS401では、ステップS310から入力された文字領域のラインに関する情報を検出する。さらに具体的には、図6に示す4つの水平ライン、すなわち、ライン1、2、3及び4が、文字領域に関して定義される。ライン1は、文字の最大の高さである。ライン2は、例えば”a”のような、高さが低い場合の文字に関する最大の高さである。ライン3は、文字の基準線である。ライン4は、例えば”j”のような、高さが低い文字に関する基準線3よりも下に伸びた文字の最大である。ステップS401では、ステップS310から入力された文字領域に関するこれらのラインの位置を決定する。ステップS402では、更なる処理のために、ライン1及び3の間に広がっている文字領域を選択する。例えば、ステップS402においては、ライン1及び3の間にのみに広がった、図6に示す”W”が更なる処理のために選択される。一方、図6に示す”a”は、ライン2及び3の間にのみ広がっており、また図6に示す”g”は、ライン2及び4の間にのみ広がっており、これらは選択されない。選択されなかった部分は、ステップS311の切断方法によっては処理されないが、勿論、切断方法の1つであるステップS313、S315、及びS317によって処理される。
【0032】
ステップS403〜S406では、ステップS402で選択された文字領域において第1の垂直バーの存在が検知される。特に、ステップS403では、選択された文字領域を描く垂直のヒストグラムを算出する。図7は、接触した文字の組合わせ”LR”71から演算した垂直のヒストグラム75の一例を示す。また、図10(d)は、他の例の垂直ヒストグラム103を示しており、これは図10(a)に示す”LI”の接触した文字の組み合せ101から算出した例である。
【0033】
ステップS404では、ヒストグラムにおいて、垂直バーの検出のための所定の垂直成分をセットし、ステップS405では、ヒストグラムにおいて、垂直成分が所定の垂直成分を超える垂直バーを検出する。図10(d)は、所定の垂直成分102(符号”h”を付している)を示しており、所定の垂直成分を超える垂直バー107及び108を有する垂直ヒストグラムを重ねて示している。図10(d)に示す例では、垂直バー107は、ステップS405で見つかる。ステップS406では、ヒストグラムにおいて、所定の垂直成分を超える次の垂直バーを検出する。図10(d)に示す例では、垂直バー108は、ステップS406において見つかる。
【0034】
次の垂直バーがステップS406において見つからない場合、文字領域は終了しており、処理の流れはステップS430からステップS431に進み、ここで、文字領域において、この切断方法が切断をなすことができなかったことを示すエラーコードが格納される(処理の流れは、図3のステップS312に進む)。ステップS406において、次の垂直バーが検出されたら、処理の流れはステップS430からステップS408に進み、ここで垂直バーの対の間の3つの独立した水平バンドの夫々における画像データの存在を確かめる。図10(b)においては、第1の水平バンドには106が付され、第2の水平バンドには105が付され、第3の水平バンドには104が付されている。これらの水平バンドの夫々は、互いに重なり合わず、互いに排他的であり、各々の水平バンドが同一の高さを有しており、互いに独立している。水平方向の横断は、図10(b)において”x”を付した点109で、ヒストグラムの水平軸と交差する垂直バー間の中間に位置する垂直線110を参照して決定される。
【0035】
ステップS409では、垂直バーの対をステップS408で検出した水平方向の横断の位置に従って、4つのクラスの1つにクラス別けされる。クラス別けは図8に示されている。図8に示すように、クラス1は、第1及び第2の水平バンドのみにおいて水平方向の横断を有する垂直バー(81)、水平方向の横断がない垂直バー(82)、第1の水平バンドのみにおいて水平方向の横断を有する垂直バー(83)を含む。クラス2は、第2及び第3の水平バンドのみにおいて水平方向の横断を有する垂直バー(84)、3つの水平バンドの全てにおいて水平方向の横断を有する垂直バー(85)を含む。クラス3は、第2の水平バンドのみにおいて水平方向の横断を有する垂直バー(86)、第1及び第2の水平バンドのみにおいて水平方向の横断を有する垂直バー(87)を含む。クラス4は、第3の水平バンドのみにおいて水平方向の横断を有する垂直バー(88)を含む。
【0036】
処理の流れは、ステップS410〜S413に進み、ここでクラス別けに基づいて、垂直バーの対の間を切断するか、しないか、また切断する場合にはどこを切断するかが決定される。
【0037】
ステップS409において垂直バーが”クラス1”としてクラス別けされた場合には、処理はステップS410を経てステップS414に進む。ステップS414では、第1の垂直バーの終点と第2の垂直バーの開始点の間の図9に示す距離”d”(符号91を付している)を算出し、最大文字距離dmax(図9においては不図示)と比較する。最大文字距離dmaxは、2つの接触した文字の2つの垂直バー間の最大距離である。ステップS414において、”d”がdmaxよりも大きくないことが判断されると、処理の流れはステップS415に進み、ここで垂直バーは図9に示す”CUT0”93で切断され、次いでステップS407に進み、ここで切断した文字が格納される。図9に示す”CUT0”93は、第1の垂直バーと第2の垂直バーとの中間に位置する切断点である。
【0038】
”d”がdmaxよりも大きいと判断されると、処理の流れはステップS416に進む。ステップS416では、第1の垂直バーが文字”L”の構成要素であるか否かを判断する。ステップS416において、第1の垂直バーが文字”L”の構成要素であると判断した場合は、処理の流れはステップS417に進み、ここで垂直バーは、図9に示す”CUT1”94で切断される。”CUT1”94は、第2の垂直バーから所定の距離であって、第2の垂直バーと、第1及び第2の垂直バーの中間点との間に位置する。”CUT1”がなされた後、処理の流れはステップS407に進み、ここで切断された文字が格納される。一方、ステップS416で垂直バーの1つが文字”L”の構成要素でないと判断した場合は、切断は行われなず、処理の流れはステップS406に進み、次の垂直バーが検出される。
【0039】
ステップS409において、垂直バーがクラス2としてクラス別けされた場合は、処理の流れはステップS410からステップS411を経てステップS418に進む。ステップS418では、図9に示す距離”d”を算出し、その距離”d”を最小距離dmin(図9においては不図示)と比較する。最小距離dminは、2つの接触した文字の2つの垂直バー間の最小距離である。ステップS418において、”d”がdminより小さいと判断した場合は、”d”がdminよりも小さいことは2つの垂直バーが同一の文字の部分であることを示しているため切断を行わない。したがって、処理の流れはステップS406に進み、ここで次の垂直バーが検出される。一方、ステップS418において、”d”がdminより小さくないことが判断された場合は、処理の流れはステップS419に進み、垂直バーが文字”R”または文字”A”のいずれかであるか否かを判断する。ステップS419において、垂直バーが文字”R”または文字”A”のいずれかの構成要素であると判断した場合、処理の流れはステップS406に進み、次の垂直バーが検出される。一方、ステップS419において、垂直バーが文字”R”または”A”のいずれの構成要素でもないと判断した場合は、ステップS420に進み、ここで”CUT1”が行われる。”CUT1”の後、処理の流れはステップS407に進み、切断した文字が格納される。
【0040】
ステップS409において、垂直バーがクラス3としてクラス別けされた場合は、処理の流れはステップS410及びS411を経てステップS412に進む。この場合は、切断はなされず、処理の流れはステップS412からステップS406に直接進み、ここで次の垂直バーが検出される。
【0041】
ステップS409において、垂直バーがクラス4としてクラス別けされた場合は、処理の流れはステップS410、S411及びステップS412を経てステップS413に進み、それからステップS421に進む。ステップS421では、図9に示す距離”d”を算出し、その距離を最大距離dmaxとオフセット定数との和と比較する(図9においては不図示)。このオフセット定数は、入力画像データにおける文字の高さの平均に基づいて予め定められた定数であり、文字の書体の変化による文字の長さの変化を補償する値を含んでいる。典型的には、このオフセット定数は、文字の高さの平均の9分の1に設定される。ステップS421において、”d”がdmaxとオフセット定数との和よりも大きくないと判断した場合、”CUT0”がなされ、その後処理の流れはステップS407に進み、切断された文字が格納される。一方、ステップS421において、”d”がdmaxとオフセット定数との和よりも大きいと判断した場合は、切断はなされず、処理の流れはステップS406に進み、次の垂直バーが検出される。
【0042】
上述したように、切断がなされず、次の垂直バーが検出される場合は、切断がなされるか、或いは次の垂直バーが検出されなくなるまで、垂直バーの次の対に関して一連の処理が繰り返えし実行される。
【0043】
上述の4つのクラス別けの各々について、接触した文字を上記の方法に適用した例を以下に説明する。
【0044】
<クラス1>
図10(a)は、接触(若しくは併合)した文字の組合わせ”LI”を示しており、画像データのテキスト領域に存在する文字”L”115と文字”I”126とを含んでいる。本実施の形態に拠れば、図3及び図4に示すフローチャートを用いて説明したように、文字”LI”の組合わせを含む画像データは、ステップS301において光学的文字認識システムに入力される。ステップS302では、入力画像データ中のテキストブロックを識別し、ステップS303では、そのテキストブロック内のテキストの行を識別する。ステップS301、S302、及びS303については、既に詳細を説明した。
【0045】
ステップS304では、上記の空白切断方法に基づいてテキストの行内の文字領域を切断する。文字の組合わせ”LI”において文字”L”115及び文字”I”126の間には空白がないため、”L”115及び”I”126はステップS304においては切断されない。ステップS305では、切断された文字が未処理のまま残っているか否かを判断する。この場合、文字の組み合せ”LI”は、未だ処理されていない。したがって、処理の流れはステップS306に進み、フラグを初期化する。その後、処理の流れはステップS307に進む。ステップS307では、切断された文字領域を認識する(ただし、文字の組合わせ”LI”が標準的な文字でない場合には、その文字の組合わせは認識されない)。次いで、処理の流れは、ステップS308に進み、ここで文字の組合わせ”LI”の認識の失敗が確かめられる。文字の組合わせ”LI”は認識されなかったので、処理の流れはステップS309からステップS310に進む。ステップS310では、文字の組合わせ”LI”が10回切断して認識されたか否かを判断する。そして、10回切断して認識された場合は、処理の流れはステップS321に進み、ここでエラーフラグが格納される。一方、文字の組合わせ”LI”が10回切断して認識されていない場合は、処理の流れはステップS311に進み、ここで文字の組合わせ”LI”は、図4に示すように、本実施の形態の文字切断方法によって切断される。
【0046】
ステップS401では、図1に示すように、ライン1、2、3及び4の位置を決定する。ステップS402では、ライン1及び3の間にのみ広がる文字領域を取り出して選択する。これには、文字の組み合わせ”LI”が含まれ、この組み合せは、更なる処理のために選択される。ステップS403では、図10(d)に示す文字の組合わせ”LI”の垂直ヒストグラムを算出する。ステップS404では、垂直ヒストグラム中の垂直バーを検出するために所定の垂直成分(図10(d)の”h”102)を設定する。その後、処理の流れはステップS405に進み、垂直ヒストグラム103において所定の垂直成分”h”102を越える垂直バー107を検出する。ステップS406では、垂直のヒストグラム103において所定の垂直成分”h”102を越える次の垂直バー108を検出する。ステップS430では、次の垂直バー108がステップS406で検出されたか否かを判断する。この例の場合、次の垂直バー108が検出されるため、処理の流れはステップS408に進む。ステップS408では、図10(b)に示すように、垂直バー107及び108の間に位置する3つの分離した水平バンド104、105、及び106の夫々において、点”x”109を含む垂直線110を横切る水平方向の交差を検出する。この例の場合(すなわち、文字の組合わせ”LI”)、図10(b)に示す水平方向の横断18が第1の水平バンド106において検出される。しかしながら、第2の水平バンド105、第3の水平バンド104においては水平方向の横断は検出されない。この処理の後、処理の流れはステップS409に進み、ここで図8に示すクラス別けの体系に基づいて垂直バー107及び108がクラス別けされる。
【0047】
この例の場合、垂直バーは、第1の水平バンド106内に位置する水平方向の横断18を有する。したがって、この例は、図10(c)に示すようなクラス別けボックスを有し、これは図8に示すクラス別けボックス83と一致する。従って、垂直バー107及び108は、クラス1の垂直バーとしてクラス別けされる。
【0048】
ステップS409で垂直バー107及び108がクラス別けされると、処理の流れはステップS410に進み、ここで垂直バーがクラス1の垂直バーとしてクラス別けされたか否かを判断する。この例の場合、ステップS409で決定されたように、垂直バー107及び108は、クラス1の垂直バーとしてクラス別けされている。したがって、処理の流れはステップS414に進む。
【0049】
先ず、図10(d)に示すように、ステップS414では、垂直バー107の終点”e”111と垂直バー108の開始点”b”112の距離”d”113を算出し、その算出した距離を最大文字距離dmax114と比較する。この例の場合、図10(d)に示すように、”d”113はdmax114より大きい。したがって、処理の流れは、ステップS414からステップS416に進み、ここで垂直バー107が文字”L”の構成要素であるか否かを判断する。この例の場合、垂直バー107は、文字”L”115の構成要素である。したがって、処理の流れはステップS416からステップS417に進み、ここで文字”L”115及び文字”I”126を夫々表す垂直バー107及び108が、図10(e)に示すように”CUT1”で切断される。垂直バーの切断の後、処理の流れはステップS407に進み、切断した文字が格納される。
【0050】
本実施の形態の文字切断方法を使用してステップS311において文字の組合わせ”LI”を切断した後、処理の流れはステップS312に進み、切断がされたか否かが判断される。この例の場合、切断がなされているため、処理の流れはステップS318に進み、文字の組合わせ”LI”がステップS311、S313、S315、若しくはS317の切断方法の1つで切断されたことを示すためフラグを1インクリメントする。次いで、ステップS307では、切断された文字”L”及び”I”を認識し、ステップS308では、ステップS307における認識の結果を確認する。文字”L”及び”I”が適切に切断されて認識された場合は、処理の流れはステップS309からステップS320に進み、認識された文字が格納される。一方、文字”L”及び”I”が適切に切断されず、適切に認識されなかった場合は、切断、認識に係る全処理、すなわち、ステップS307〜S318が繰り返される。本実施の形態の処理は、1つの接触した文字の組合わせに関して10回実行され、その後処理の流れはステップS310からステップS321に進み、エラーフラグが格納される。
【0051】
<クラス2>
図12(a)は、本実施の形態の光学的文字認識システムに入力される画像データにおいて見つかる接触した文字の組み合せ”FN”を示している。この例の場合、ステップS301〜ステップS310は、前述の接触した文字の組み合せ”LI”の場合と同様であるので、その詳細に関しては説明を省略する。ステップS301〜S310に続くステップS311において、接触した文字の組合わせ”FN”は、本実施の形態の文字切断方法に基づいて切断される。
【0052】
図4は、本実施の形態の文字切断方法を示している。先ず、ステップS401及びS402では、接触した文字の組合わせ”FN”を選択する。この選択の詳細は、接触した文字の組合わせ”LI”に関する上記の説明と同様であるので、その詳細に関しては説明を省略する。次のステップS403では、図12(c)に示す接触した文字の組み合せ”FN”の垂直ヒストグラム172を算出し、ステップS404では、所定の垂直成分”h”102を設定する。ステップS405では、垂直ヒストグラム172における垂直バー139を検出し、ステップS406では、垂直ヒストグラム172における次の垂直バー140を検出する。接触した文字の組合わせ”LI”に関する例のように、垂直バー139及び140の双方が所定の垂直成分”h”102を超えている。次いで、処理の流れはステップS430からステップS408に進み、ここで垂直バー139及び140の間に位置する3つの水平バンド155、156、及び157の夫々について、線173における水平方向の横断を検出する。水平方向の横断159は、第2の水平バンド156において検出され、水平方向の横断160は、第3の水平バンド157において検出される。第1の水平バンド155においては水平方向の横断は検出されない。したがって、垂直バー139及び140は、図8及び図12(b)に示すように、クラス別けボックス84と一致する水平方向の横断を有する。
【0053】
ステップS409において垂直バー139及び140のクラス別けがされると、処理の流れはステップS410を経てステップS411に進み、垂直バーがクラス2の垂直バーとしてクラス別けされたか否かが判断される。この例の場合、ステップS409において判断したように、垂直バー139及び140は、クラス2の垂直バーとしてクラス別けされる。したがって、処理の流れはステップS418に進む。
【0054】
図12(c)に示すように、ステップS418では、垂直バー139の終点”e”170と垂直バー140の開始点”b”171との距離”d”160を算出し、その算出した距離と最小文字距離dmin161とを比較する。この例の場合は、”d”160は、dmin161よりも小さくない。したがって、処理の流れは、ステップS419に進み、ここで垂直バー139及び垂直バー140が文字”R”または文字”A”のいずれかであるか否かを判断する。この例の場合、垂直バー139及び140は、文字の組合わせ”FN”の構成要素であり、文字”R”または文字”A”の構成要素ではない。したがって、処理の流れはステップS420に進み、図12(a)に示すように、”CUT1”202がなされる。その後、処理の流れはステップS407に進み、切断された文字が格納される。
【0055】
上述の本実施の形態の文字切断方法が終了した後、処理の流れはステップS311からステップS312に進む。文字の組合わせ”FN”に関する以降の認識処理は、文字の組合わせ”LI”に関する認識処理と同様であるので、それに関する説明は省略する。
【0056】
<クラス3>
図11(a)は、本実施の形態の光学的文字認識システムに入力される画像データにおいて見つかる接触した文字の組み合せ”HE”を示している。この例の場合、本実施の形態のステップS301〜ステップS310は、前述の接触した文字の組合わせ”LI”の例と同様であるため、詳細の説明は省略する。ステップS301〜S310に次いで、ステップS311において、接触した文字の組合わせ”HE”は、図4に示すように、本実施の形態の文字切断方法に基づいて切断される。
【0057】
ステップS401及びS402は、接触した文字の組合わせ”HE”を選択する。この選択の詳細は、接触した文字の組合わせ”LI”に関する上記の説明と同様であるため、ここではその詳細の説明を省略する。ステップS403では、接触した文字の組合わせ”HE”の垂直ヒストグラム(不図示)を算出し、ステップS404では、所定の垂直成分を設定する。ステップS405では、垂直ヒストグラムにおける垂直バー119を検出し、ステップS406では、垂直ヒストグラムにおける次の垂直バー120を選択する。その後、処理の流れはステップS430からステップS408に進み、ここで図11(b)に示すように、垂直バー119及び120の間に位置する3つの分離した水平バンド116、117、及び118の夫々における線122での水平方向の横断が検出される。垂直バー119及び120は、図11(c)に示す文字”H”163の構成要素を表わしているため、本実施の形態の文字切断方法は、先ず、文字”H”163を切断すべきか否かに関して処理する。ステップS408では、水平方向の横断142だけが線122で検出される。水平方向の横断142は、図11(b)及び11(c)に示すように、第2の水平バンド117において検出される。第1の水平バンド118、第3の水平バンド116においては、水平方向の横断は検出されない。したがって、文字”H”163に関しては、垂直バー119及び120は、図8及び図11(d)に示すように、クラス別けボックス86と一致する水平方向の横断を有する。したがって、垂直バー119及び120は、クラス3の垂直バーとてクラス別けされる。
【0058】
この例の場合は、ステップS409において決定されたように、垂直バー119及び120は、クラス3の垂直バーとしてクラス別けされている。したがって、切断はなされず、処理の流れはステップS410及びS411を経て、直接ステップS406に進み、ここで次の垂直バーが検出される。
【0059】
この例の場合は、ステップS406では、図11(b)及び(e)に示す次の垂直バー121を検出する。したがって、処理の流れはステップS430からステップS408に進み、ここで垂直バー120及び121の間に位置する3つの水平バンド116、117、及び118の夫々における線146での水平方向の横断が検出される。この例の場合(すなわち、図11(e)に示す文字”H”163及び文字”E”164の間の接触した領域)、水平方向の横断144が、第3の水平バンド116において検出され、水平方向の交差145が第1の水平バンド118において検出される。第2の水平バンド117においては、水平方向の横断は検出されない。したがって、図11(e)に示す接触した文字の組合わせ”HE”は、図8及び図11(f)に示すクラス別けボックス81と一致する水平方向の横断を有する。そこで、ステップS409では、垂直バー120及び121は、クラス1の垂直バーとしてクラス別けされる。
【0060】
この例の場合、ステップS409において決定したように、垂直バー120及び121は、クラス1の垂直バーとしてクラス別けされている。したがって、処理の流れはステップS409からステップS410を経てステップS414に進む。
【0061】
先ず、図11(e)に示すように、ステップS414では、垂直バー120の終点”e”143と垂直バー121の開始点”b”123の距離”d”124を算出し(不図示のヒストグラムに基づいて算出)し、その算出した距離を最大文字距離dmax114と比較する。この例の場合、図11(e)に示すように、”d”124は、dmax114より大きくない。したがって、処理の流れはステップS414からステップS415に進み、ここで図11(g)に示すように、”CUT0”203がなされる(線146に沿ってなされる)。この切断の後、処理の流れはステップS407に進み、切断された文字が格納される。
【0062】
本実施の形態の文字切断方法が終了した後、処理の流れはステップS311からステップS312に進む。接触した文字の組合わせ”HE”に関する以降の処理は、文字の組合わせ”LI”に関する認識処理と同様であるため、その詳細に関する説明は省略する。
【0063】
<クラス4>
図5(a)は、本実施の形態の光学的文字認識システムに入力する画像データにおいて見つかる接触した文字の組合わせ”UM”165を示している。この例の場合、本実施の形態のステップS301〜ステップS310は、上記の接触した文字の組合わせ”LI”の例と同様であるため、その詳細な説明は省略する。ステップS301〜S310に次いでステップS311では、図4に示すように、本実施の形態の文字切断方法に基づいて接触した文字の組合わせ”UM”を切断する。
【0064】
ステップS401及びS402では、接触した文字の組合わせ”UM”を選択する。選択の詳細は、接触した文字”LI”に関する上記の説明と同様であるため、その説明を省略する。次のステップS403では、所定の垂直成分をセットする。ステップS405では、垂直ヒストグラムにおける垂直バーを検出し、ステップS406では、垂直ヒストグラムにおける次の垂直バーを検出する。次いで、処理の流れはステップS430からステップS408に進み、ここで垂直バー125及び130の間に位置する3つの水平バンド147、148、及び149の夫々における線150での水平方向の横断が検出される。垂直バー125及び130は、図5(b)に示す文字”U”166の構成要素を表しているため、本実施の形態の文字切断方法は、先ず文字”U”166を切断すべきか否かに関して処理する。ステップS408では、最初の水平バンド147の中に位置する線150を含む水平方向の横断151だけが検出され、第2の水平バンド148、第3の水平バンド149においては水平方向の横断が検出されない。したがって、文字”U”166に関しては、垂直バー125及び130は、図8及び図5(c)に示すクラス別けボックス83と一致する水平方向の横断を有する。したがって、垂直バー125及び130は、クラス1の垂直バーとしてクラス別けされる。
【0065】
この例の場合は、ステップS409において決定されたように、垂直バー125及び130は、クラス1の垂直バーとしてクラス別けされる。したがって、処理の流れはステップS410からステップS414に進む。
【0066】
先ず、図5(b)に示すように、ステップS414では、垂直バー125の終了点”e”132と垂直バー130の開始点”b”133の距離”d”134が算出され(不図示のヒストグラムに基づいて算出)、その算出した距離を最大文字距離dmax114と比較する。この例の場合は、図5(b)に示すように、”d”134は、dmax114より大きい。したがって、処理の流れはステップSステップS414からステップS416に進み、ここで垂直バー125が文字”L”の構成要素であるか否かが判断される。この例の場合は、垂直バー125は、文字”L”の構成要素ではない。したがって、切断はなされず、処理の流れはステップS406に進み、ここで次の垂直バーが検出される。
【0067】
この例の場合は、ステップS406で次の垂直バー311を検出する。したがって、処理の流れはステップS430からステップS408に進み、ここで図5(a)及び5(d)に示すように、垂直バー130及び131の間に位置する3つの水平バンド147、148、及び149の夫々における線153での水平方向の横断が検出される。この例の場合(すなわち、図5(d)に示す文字”U”166及び文字”M”167の間の接触領域)は、水平方向の横断154は、第3の水平バンド149において検出され、第1の水平バンド147、第2の水平バンド148においては検出されない。したがって、図5(d)に示す接触した文字の組合わせ”UM”は、図8及び図5(e)に示すクラス別けボックス88と一致する水平方向の横断を有する。したがって、ステップS409では、垂直バー130及び131をクラス4の垂直バーとしてクラス別けする。
【0068】
この例の場合は、ステップS409において決定したように、垂直バー130及び131は、クラス4の垂直バーとしてクラス別けされる。したがって、処理の流れはステップS410、S411、及びS412を経て、ステップS413に進み、それからステップS421に進む。
【0069】
先ず、図5(d)に示すように、ステップS421では、垂直バー130の終了点”e”135と垂直バー131の開始点”b”136の距離”d”137を算出(不図示のヒストグラムに基づいて算出)し、その算出した距離を、最大文字距離dmax114とオフセット定数との和と比較する。この例の場合は、図5(d)に示すように、”d”137はdmax114とオフセット定数との和より大きくない。したがって、処理の流れはステップS421からステップS422に進み、ここで図5(f)に示すように、”CUT0”204がなされる。切断がなされた後、処理の流れはステップS407に進み、切断された文字が格納される。
【0070】
ステップS311において上記の本実施の形態の文字切断方法が終了した後、認識処理はステップS311からS312に進む。接触した文字の組合わせ”UM”に関する以降の認識処理は、接触した文字の組合わせ”LI”に関する認識処理と同様であるため、それに関する説明は省略する。
【0071】
上記の例は、本発明によって切断し、認識される、接触した文字の組合わせの一例に過ぎない。本発明は、文字または書体の種類に拘わらず、接触した文字の組合せについて広く適用することができる。
【0072】
また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用しても良い。また、本発明はシステム或いは装置にプログラムを供給することによって達成される場合にも適用できることはいうまでもない。この場合、本発明を達成するためのソフトウェアによって表されるプログラムを格納した記憶媒体から、該プログラムを該システム或は装置に読み出すことによって、そのシステム或は装置が、本発明の効果を享受することが可能となる。
【0073】
【発明の効果】
以上説明したように本発明に拠れば、接触した文字を認識する精度を高めることができるという効果がある。
【0074】
【図面の簡単な説明】
【図1】本発明の光学的文字認識システムの動作において使用されるコンピュータ装置の斜視図である。
【図2】図1に示す光学的文字認識システムのブロック図である。
【図3】本発明の光学的文字認識システムの動作を示すフローチャートである。
【図4(a)】本発明の文字切断技術のフローチャートである。
【図4(b)】本発明の文字切断技術のフローチャートである。
【図5】(a)は接触した文字の組合わせの一例を示す図である。
(b)は(a)に示す文字の組合わせのうち切断しない部分を示す図である。
(c)は(b)に対応するクラス別けボックス(クラス1)を示す図である。
(d)は(a)に示す文字の組合わせのうち切断する部分を示す図である。
(e)は(d)に対応するクラス別けボックス(クラス4)を示す図である。
(f)は(a)に示す文字の組合わせの切断位置を示す図である。
【図6】代表的なテキストラインを示す図である。
【図7】接触した文字とそのヒストグラムの例を示す図である。
【図8】本発明の文字切断技術において使用するクラス別けの体系を示す図である。
【図9】本発明の文字切断技術で使用する、垂直バーの間で切断するための2つの選択を(CUT0、CUT1)を示す図である。
【図10】(a)は接触した文字の組合わせの一例を示す図である。
(b)は(a)に示す文字の組み合せに関する処理を説明する図である。
(c)は(b)に対応するクラス別けボックス(クラス1)を示す図である。
(d)は(a)に示す文字の組合わせのヒストグラムを示す図である。
(e)は(a)に示す接触した文字の切断位置を示す図である。
【図11】(a)は接触した文字の組合わせの一例を示す図である。
(b)は(a)に示す文字の組み合せに関する処理を説明する図である。
(c)は(a)に示す文字の組合わせのうち切断しない部分を示す図である。
(d)は(c)に対応するクラス別けボックス(クラス3)を示す図である。
(e)は(a)に示す文字の組合わせのうち切断する部分を示す図である。
(f)は(e)に対応するクラス別けボックス(クラス1)を示す図である。
(g)は(a)に示す接触した文字の切断位置を示す図である。
【図12】(a)は接触した文字の組合わせの一例を示す図である。
(b)は(a)に対応するクラス別けボックス(クラス2)を示す図である。
(c)は(a)に示す文字の組合わせのヒストグラムを示す図である。

Claims (10)

  1. 少なくとも2つの接触した文字を含む文字画像データから独立した文字を切り出す画像処理方法であって、
    文字画像データにおける垂直バーの対を検出する検出工程と、
    前記垂直バーの対の間に位置する複数の独立した水平バンドの夫々において、像データが存在するかどうか確認する確認工程と、
    前記確認工程で像データを含むと確認された水平バンドに基づいて、前記垂直バーの対をクラス別けするクラス別け工程と、
    前記クラス別けの結果と前記垂直バーの対の間の距離と前記垂直バーが特定の文字の構成要素であるか否かとに基づいて前記垂直バーの対の間を切断するか否かとの切断の位置を決定する決定工程と、
    を備えることを特徴とする画像処理方法。
  2. 更に、前記文字画像データの垂直ヒストグラムを生成する工程を備え、前記検出工程では、前記生成された垂直ヒストグラムに基づいて、前記垂直バーの対を検出することを特徴とする請求項1に記載の画像処理方法。
  3. 前記確認工程では、前記垂直バーの対の間に位置し且つ夫々の水平バンドを突き抜ける垂直線上において、夫々の水平バンドにおいて水平方向の横断があるかどうか確認することによって、像データが存在するかどうか確認することを特徴とする請求項1に記載の画像処理方法。
  4. 前記垂直線は、前記垂直バーの対の間の中央に位置することを特徴とする請求項3に記載の画像処理方法。
  5. 更に、字の基準線と最大高さとの間に広がる文字を前記文字画像データとして選択する選択工程を備えることを特徴とする請求項1に記載の画像処理方法。
  6. 前記確認工程では、前記3つの独立した水平バンドの夫々において、像データが存在するかどうか確認し、
    前記クラス別け工程では、前記確認工程で像データを含むと確認された水平バンドに基づいて、前記垂直バーの対を4つのクラスのいずれかに分類されるものであって、前記前記クラス別け工程では、前記垂直バーの対を、
    (i)(a)像データが第1の水平バンド及び第3の水平バンドの両者のみに存在する場合、(b)像データが前記第1の水平バンドにのみ存在する場合、及び(c)像データが3つの水平バンドのいずれにも存在しない場合のいずれかに属する場合は、第1のクラスとして分類し、
    (ii)(a)像データが第2の水平バンド及び前記第3の水平バンドの両者にのみ存在する場合、及び(b)像データが3つの水平バンドの全てに存在する場合のいずれかに属する場合は、第2のクラスとして分類し、
    (iii)(a)像データが前記第2の水平バンドにのみ存在する場合、及び(b)像データが前記第1の水平バンド及び前記第2の水平バンドにのみ存在する場合のいずれかに属する場合は、第3のクラスとして分類し、
    (iv)像データが前記第3の水平バンドにのみ存在する場合は、第4のクラスとして分類することを特徴とする請求項1に記載の画像処理方法。
  7. 前記決定工程で切断すると決定した場合、当該決定された切断の位置に基づいて、前記垂直バー対の間を切断する切断工程を更に備えることを特徴とする請求項1に記載の画像処理方法。
  8. 前記決定工程で切断しないと決定した場合、次の垂直バーを検出して、第2の垂直バーの対を検出し、当該検出した第2の垂直バー対を前記垂直バー対として、前記確認工程とクラス別け工程と決定工程とを繰り返すことを特徴とする請求項1に記載の画像処理方法。
  9. 前記文字画像データは、文字認識処理で識別できなかった文字であることを特徴とする請求項1に記載の画像処理方法。
  10. 少なくとも2つの接触した文字を含む文字画像データから独立した文字を切り出す画像処理装置であって、
    文字画像データにおける垂直バーの対を検出する検出手段と、
    前記垂直バーの対の間に位置する複数の独立した水平バンドの夫々において、像データが存在するかどうか確認する確認手段と、
    前記確認手段で像データを含むと確認された水平バンドに基づいて、前記の垂直バーの対をクラス別けするクラス別け手段と、
    前記クラス別けの結果と前記垂直バーの対の間の距離と前記垂直バーが特定の文字の構成要素であるか否かとに基づいて前記垂直バーの対の間を切断するか否かその切断の位置を決定する決定手段と、
    を備えることを特徴とする画像処理装置。
JP28153295A 1994-11-09 1995-10-30 画像処理装置及び光学的文字認識装置及びそれらの方法 Expired - Fee Related JP3805005B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US33753894A 1994-11-09 1994-11-09
US08/337538 1994-11-09

Publications (2)

Publication Number Publication Date
JPH08293001A JPH08293001A (ja) 1996-11-05
JP3805005B2 true JP3805005B2 (ja) 2006-08-02

Family

ID=23320931

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28153295A Expired - Fee Related JP3805005B2 (ja) 1994-11-09 1995-10-30 画像処理装置及び光学的文字認識装置及びそれらの方法

Country Status (2)

Country Link
US (1) US5809166A (ja)
JP (1) JP3805005B2 (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9722766D0 (en) 1997-10-28 1997-12-24 British Telecomm Portable computers
US7663607B2 (en) 2004-05-06 2010-02-16 Apple Inc. Multipoint touchscreen
US6323846B1 (en) 1998-01-26 2001-11-27 University Of Delaware Method and apparatus for integrating manual input
JP4392907B2 (ja) * 1999-07-30 2010-01-06 株式会社東芝 文字切出し方法
US6473517B1 (en) * 1999-09-15 2002-10-29 Siemens Corporate Research, Inc. Character segmentation method for vehicle license plate recognition
WO2001059576A1 (en) 2000-02-12 2001-08-16 Adobe Systems Incorporated Text grid creation tools
US7305617B2 (en) * 2000-02-12 2007-12-04 Adobe Systems Incorporated Method for aligning text to baseline grids and to CJK character grids
US7071941B2 (en) * 2000-02-12 2006-07-04 Adobe Systems Incorporated Method for calculating CJK emboxes in fonts
US6928611B2 (en) 2000-09-25 2005-08-09 Adobe Systems Incorporated Setting text composition spacing amount
JP3795784B2 (ja) * 2000-09-25 2006-07-12 アドビ システムズ, インコーポレイテッド アイコン表示付き文字組空き量設定装置、文字組空き量設定プログラム及びそれを記録した記録媒体
JP3554271B2 (ja) * 2000-12-13 2004-08-18 パナソニック コミュニケーションズ株式会社 情報通信装置
US7296227B2 (en) 2001-02-12 2007-11-13 Adobe Systems Incorporated Determining line leading in accordance with traditional Japanese practices
US7167274B2 (en) * 2001-09-28 2007-01-23 Adobe Systems Incorporated Line leading from an arbitrary point
US7039862B2 (en) * 2002-05-10 2006-05-02 Adobe Systems Incorporated Text spacing adjustment
US20040125107A1 (en) * 2002-12-26 2004-07-01 Mccully Nathaniel M. Coordinating grid tracking and mojikumi spacing of Japanese text
US7123261B2 (en) * 2002-12-26 2006-10-17 Adobe Systems Incorporated Coordinating grid tracking and mojikumi spacing of Japanese text
US7283669B2 (en) * 2003-01-29 2007-10-16 Lockheed Martin Corporation Fine segmentation refinement for an optical character recognition system
US7594171B2 (en) 2004-10-01 2009-09-22 Adobe Systems Incorporated Rule-based text layout
US8552989B2 (en) 2006-06-09 2013-10-08 Apple Inc. Integrated display and touch screen
KR102481798B1 (ko) 2006-06-09 2022-12-26 애플 인크. 터치 스크린 액정 디스플레이
CN104965621B (zh) 2006-06-09 2018-06-12 苹果公司 触摸屏液晶显示器及其操作方法
US8130203B2 (en) 2007-01-03 2012-03-06 Apple Inc. Multi-touch input discrimination
US7855718B2 (en) 2007-01-03 2010-12-21 Apple Inc. Multi-touch input discrimination
US7876310B2 (en) 2007-01-03 2011-01-25 Apple Inc. Far-field input identification
US8269727B2 (en) 2007-01-03 2012-09-18 Apple Inc. Irregular input identification
US8493330B2 (en) 2007-01-03 2013-07-23 Apple Inc. Individual channel phase delay scheme
US9710095B2 (en) 2007-01-05 2017-07-18 Apple Inc. Touch screen stack-ups
US7844915B2 (en) 2007-01-07 2010-11-30 Apple Inc. Application programming interfaces for scrolling operations
US8633930B2 (en) * 2007-03-26 2014-01-21 Apple Inc. Non-linear text flow
EP2225700A4 (en) * 2007-11-30 2014-04-23 Lumex As METHOD FOR PROCESSING OPTICAL IDENTIFICATION (OCR) OUTPUT DATA, WHERE THE OUTPUT DATA CONTAIN DOUBLE PRINTED SIGNATURE PICTURES
US9002096B2 (en) * 2009-01-06 2015-04-07 Siemens Healthcare Diagnostics Inc. Method and apparatus for determining a liquid level in a container using imaging
US8571270B2 (en) * 2010-05-10 2013-10-29 Microsoft Corporation Segmentation of a word bitmap into individual characters or glyphs during an OCR process
US8804056B2 (en) * 2010-12-22 2014-08-12 Apple Inc. Integrated touch screens
US9922263B2 (en) * 2012-04-12 2018-03-20 Tata Consultancy Services Limited System and method for detection and segmentation of touching characters for OCR
CN106446896B (zh) * 2015-08-04 2020-02-18 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备
US10068146B2 (en) * 2016-02-25 2018-09-04 Conduent Business Services, Llc Method and system for detection-based segmentation-free license plate recognition
JP7090894B2 (ja) * 2018-07-26 2022-06-27 武蔵エンジニアリング株式会社 文字列表示装置および文字列表示方法
JP7406884B2 (ja) * 2019-06-27 2023-12-28 キヤノン株式会社 情報処理装置、プログラム及び制御方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3346845A (en) * 1964-12-11 1967-10-10 Bunker Ramo Character recognition method and apparatus
US3868636A (en) * 1973-06-18 1975-02-25 Isotec Inc Optical character reader having feature recognition capability
US5046114A (en) * 1985-10-01 1991-09-03 The Palantir Corporation Method and structure for separating joined patterns for use in pattern and character recognition system
US4918740A (en) * 1985-10-01 1990-04-17 Palantir Corporation Processing means for use in an optical character recognition system
JPH0634256B2 (ja) * 1987-03-04 1994-05-02 シャープ株式会社 接触文字切出し方法
JPH01112388A (ja) * 1987-10-26 1989-05-01 Ricoh Co Ltd 文字認識処理方法
US4998285A (en) * 1988-03-11 1991-03-05 Kabushiki Kaisha Toshiba Character recognition apparatus
US5048097A (en) * 1990-02-02 1991-09-10 Eastman Kodak Company Optical character recognition neural network system for machine-printed characters
US5321770A (en) * 1991-11-19 1994-06-14 Xerox Corporation Method for determining boundaries of words in text
US5384864A (en) * 1993-04-19 1995-01-24 Xerox Corporation Method and apparatus for automatic determination of text line, word and character cell spatial features

Also Published As

Publication number Publication date
JPH08293001A (ja) 1996-11-05
US5809166A (en) 1998-09-15

Similar Documents

Publication Publication Date Title
JP3805005B2 (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
US5452374A (en) Skew detection and correction of a document image representation
US5410611A (en) Method for identifying word bounding boxes in text
US6512848B2 (en) Page analysis system
JP3996579B2 (ja) 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム
JP3232143B2 (ja) 復号していない文書画像の修正版を自動的に作成するための装置
US6356655B1 (en) Apparatus and method of bitmap image processing, storage medium storing an image processing program
US6711292B2 (en) Block selection of table features
JP2835178B2 (ja) 文書読取装置
US6947596B2 (en) Character recognition method, program and recording medium
US6496600B1 (en) Font type identification
CN113378839A (zh) 信息处理装置、信息处理方法及计算机可读介质
US20010043742A1 (en) Communication document detector
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP3186246B2 (ja) 文書読取装置
JPH08221558A (ja) 文書ファイリング方法及び装置
JP3186712B2 (ja) 文書読取装置
JPS5949671A (ja) 光学的文字読取装置
JPH0388086A (ja) 文書読取装置
JPH0689330A (ja) 画像ファイリングシステム
JPH09288714A (ja) 表認識方法および装置
JPH11250179A (ja) 文字認識装置および文字認識方法
JP2002157550A (ja) 文字認識装置、文字認識方法、および記録媒体
JP4544691B2 (ja) 文字読取装置
JPH0696274A (ja) 文字等の認識方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060418

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060509

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100519

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100519

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110519

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120519

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120519

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130519

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140519

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees