JP3977468B2 - シンボル分類装置 - Google Patents

シンボル分類装置 Download PDF

Info

Publication number
JP3977468B2
JP3977468B2 JP31993596A JP31993596A JP3977468B2 JP 3977468 B2 JP3977468 B2 JP 3977468B2 JP 31993596 A JP31993596 A JP 31993596A JP 31993596 A JP31993596 A JP 31993596A JP 3977468 B2 JP3977468 B2 JP 3977468B2
Authority
JP
Japan
Prior art keywords
symbol
sample
equivalence class
symbols
match
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP31993596A
Other languages
English (en)
Other versions
JPH09198511A (ja
Inventor
デイヴィーズ ダニエル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JPH09198511A publication Critical patent/JPH09198511A/ja
Application granted granted Critical
Publication of JP3977468B2 publication Critical patent/JP3977468B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/46Conversion to or from run-length codes, i.e. by representing the number of consecutive digits, or groups of digits, of the same kind by a code word and a digit indicative of that kind
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/005Statistical coding, e.g. Huffman, run length coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、テキストの走査画像の圧縮の分野に関する。
【0002】
【従来の技術及び発明が解決しようとする課題】
デジタル化された画像の一般的な使用に対する主な障害は、それらのサイズである。300ドット/インチ(dpi )の8.5×11インチの画像は、およそ8,000,000個のピクセルを含む。走査画像の二値化により1ピクセルにつき1ビットまでビット数が減少された後でさえ、まだ1メガバイトである。圧縮方法は、典型的にLOSSLESS(ロスレス)又はLOSSY (ロシー)と特徴づけられる。LOSSLESS圧縮方法では、データは圧縮及びその後の圧縮解除中に消失されない。LOSSY 圧縮方法では、所定量のデータが消失されるが、圧縮されたデータの本質は圧縮解除後も保持されるのでデータの消失は許容できる。
【0003】
CCITTグループ3又はグループ4のようなバイナリ画像に対する一般的なLOSSLESS圧縮方法は、1/10〜1/20にバイナリ画像を圧縮できる。同等画像を作成するために使用される合成電子フォームに比較すると、これでもまだ大きい。
【0004】
ほとんどの文書はテキストを含む。バイナリ画像においてテキストを圧縮する一つの方法は、光学文字認識を実行してテキストストリームを作成し、ある種のテキスト圧縮スキームを使用してテキストストリームを圧縮し、得られたものを格納することである。あいにく、キャラクタ、フォント、フェース及び位置の選択において生じるミスは、しばしば問題を含む。
【0005】
別の方法は、見出されるシンボルを同値類にグループ化することである。この方法では、シンボルがバイナリ画像から抽出され、一つ以上の同値類に対するテンプレートにマッチングされる。分類は部分的には、幅、高さ、マス(黒ピクセルの数)等のシンボルの特徴に基づく。典型的に、テンプレートは同値類を示すシンボルの「ビットマップ」である。主要な分類基準は、エラーピクセルの位置、構成及び数に基づく。エラーピクセルは、抽出されたシンボル又はテンプレートの両方ではなくどちらか一方において「オン」となるピクセルと定義される。圧縮された出力ファイルは、各シンボルの位置と、同値類を表すために使用される同値類の標本のIDと、各同値類の標本の1つの表現(テンプレート)とを含む。
【0006】
うまく実行されると、この方法は標準的なLOSSLESS圧縮で実行されるあらゆるシンボルの個々の符号化を全て回避する。この方法はまた、(未知のフォントで)印刷、ファックス、コピー及び走査されることによって質の低下したキャラクタの外観及び間隔を適切に表現するフォント及びフェースを見出そうとすることに関連する問題の多くを回避する。詳細には、この方法はローマ字でないキャラクタセット、破壊及び結合されたキャラクタ、グラフィクス、及びページ上に現れる他のいずれにもはたらく。従来のスキームは、シンボルのビットマップを標本のビットマップと比較することによって分類を実行する。
【0007】
従ってそのようなシステムの中心となるのはシンボル分類子である。良好な圧縮を得るには、分類子は少数の同値類を生成すべきである。シンボル置換エラーを回避するために、分類子は新しいシンボルが既存のテンプレートのいずれにもマッチしないことを実際に確信する度に、新たな同値類を作成しなければならない。これでは多数の同値類が作成されがちである。バイナリ画像中のテキストのキャラクタセットに馴染んだ人間により使用される測定基準を正確に測定する分類子を有することが目的である。しかし、既知の分類子はこれらの測定基準とあまり関連性のないシンボル特徴を測定する。これはでは、シンボルが置換されたり、極端な数の同値類が生成されたりすることになる。
【0008】
シンボルマッチングに基づく画像圧縮の例は、”Method and Apparatus For Compression of Images”と題され、1994年4月12日に出願されたマーク(Mark)他による米国特許番号第5,303,313号('313特許)に記載されている。'313特許では画像はシンボルのマッチングに先立って「予備圧縮」される。'313特許は、このような予備圧縮のためにランレングス符号化の使用を述べている。シンボルは、ランレングス表現から抽出される。投票スキームは、シンボルマッチングの正確さを向上するために複数の類似テストと共に使用される。'313特許はさらに、マッチするシンボルに基づいてテンプレートが修正され得るテンプレート構成スキームを開示する。
【0009】
【課題を解決するための手段】
走査シンボルの同値類への分類方法及び装置を示す。本発明は、水平方向及び垂直方向の両方向におけるランレングス情報に基づいてランレングスシンボル抽出を実行し、シンボルを分類する。同値類は1つの標本により表される。標本とのマッチングのための特徴に基づいた分類規準は、対応する標本テンプレートによって定義される。標本テンプレートは、各々が一つ以上のシンボルにマッチする規準を定義する水平方向及び垂直方向テンプレートグループを含む。特徴ベースの分類規準は全て、ランの終点から容易に計算できる量を使用する。
【0010】
本発明のシンボル分類方法は概して;シンボルを抽出するステップと;抽出されたシンボルを整合のために準備するステップと;比較される同値類を識別するステップと;シンボルの特徴をラン情報から生成するステップと;識別された同値類の1つから標本テンプレートを得るステップと;シンボルが標本のサイズ及び傾斜(度)のしきい値を満たすことをチェックするステップであって、抽出されたシンボルが小さい場合には小シンボルチェックを実行するステップと;必要であれば抽出されたシンボル又は標本テンプレートを調整するステップと;標本テンプレートグループの規準を満たすシンボルランを見出すステップであって、全てのテンプレートグループ規準が満たされ、全てのシンボルランが消費され、マッチするものがあれば、標本にマッチングするための識別子及びシンボルの位置を記録するステップと;を含む。これは、比較に対して識別される各同値類に対してマッチするものが見つかるまで繰り返される。マッチするものがなければ、抽出されたシンボルを標本として用いて新たな同値類が作成される。小シンボルチェックは概して、小さいシンボルに特に関連があると決定されたシンボル特徴を同値類の標本のしきい値に比較することを含む。
【0011】
同値類の数の減少は、同値類の統合と呼ばれるプロセスを通して達成される。同値類の統合では、上述されたシンボル分類プロセスを使用して標本同士がマッチングされる。各標本の3つのバージョン、即ちオリジナルの標本と、1ピクセル分上にシフトされた標本と、1ピクセル分右にシフトされた標本とが、他の同値類とマッチングされる。これはミスアラインメント(不整列、不整合)又はノイズの影響を最小化することに貢献すると共に、可能な限りマッチするものを見つけ出すことを容易にする。統合同値類を表すのに使用される標本の選択は、どの標本がほとんどのシンボルにマッチするかを決定することにより行われる。
【0012】
本発明の一態様は、バイナリ符号化された画像データ中に含まれるシンボルを分類する方法であって、a)シンボルのランレングス符号化表現を抽出するステップを含み、b)前記抽出されたシンボルのシンボル特徴を前記ランレングス符号化表現から決定するステップを含み、c)前記抽出されたシンボルが比較され得る1セットの同値類をディクショナリから選択するステップを含み、該ディクショナリが以前に抽出されたシンボルから作成された同値類を含み、各同値類がテンプレートを含み、該テンプレートが前記同値類を表す標本にマッチングするための情報を含み、d)マッチするものが見出されるまで、又はマッチするものがない場合には全ての標本が比較されるまで、前記協働するテンプレートを用いて前記セットの同値類の各々の標本と前記抽出されたシンボルを比較するステップを含み、該比較ステップが、d1)第1セットのシンボル特徴が、比較されている標本のテンプレートにおいて特定される対応するしきい値範囲内にあるかどうかを決定するサブステップと、d2)前記第1セットのシンボル特徴のいずれかが前記しきい値範囲内にない場合に、抽出されたシンボルが比較されている標本にマッチしないことを示すサブステップと、d3)前記第1セットのシンボル特徴の全てが前記しきい値範囲にある場合に、前記抽出されたシンボルにおけるランが、比較されている標本のテンプレートにおいて特定されるラン終点規準を満たすかどうかを決定するサブステップと、を含み、前記分類方法がさらに、e)前記比較ステップdによりマッチするものが得られた場合に、前記抽出されたシンボルが比較されている標本の同値類中に存在することを示すステップを含み、f)前記比較ステップdによりマッチするものが得られない場合に、前記抽出されたシンボルを標本として用いて新たな同値類を作成するステップを含み、g)該新たな同値類を前記ディクショナリに追加するステップを含む、ことを特徴とする。
【0013】
【発明の実施の形態】
走査シンボルを同値類に分類する方法及び装置を示す。本発明は、光学文字認識(OCR)やデータの暗号化やデータ圧縮等の種々のアプリケーションで使用され得る。かかるアプリケーションは、全体的な画像処理システムとして又はスタンドアロンアプリケーションとして見出され得る。
【0014】
以下の用語及びそれらの意味は以下のように用いられる。
「画像」は、媒体上にマーキングされたもの、又は媒体の外観に関していう。
「画像データ」は、画像の再生に使用され得る画像表現である。
「同値類」は、問題を生じる程に画像の外観を変更することなく互いに置換されることのできる、画像中に見出されるシンボルのセットである。
「同値類の標本」は、画像が圧縮解除又はさもなければ再生される時に同値類の全てのメンバに対して置換されるシンボルである。
「標本テンプレート」又は「テンプレート」は、シンボルを標本にマッチングするのに使用されるデータ構造及び規準のセットである。
「抽出(された)シンボル」又は「シンボル」は、画像データから得られる媒体上のマーキングの画像表現である。
【0015】
本発明は、向上されたシンボル分類子に関する。好適な実施形態のシステムは、同値類のリスト(またはディクショナリと呼ぶ)を使用し、維持する。抽出シンボルは、それが既存の同値類に追加されるべきかどうかを決定するために同値類の標本(複数)に比較される。マッチするものがなければ、抽出シンボルを標本として用いて新しい同値類が作成される。
【0016】
上記のように、本発明は種々のアプリケーションで使用され得る。図1は、本発明を使用するアプリケーションの概略ステップを記述するフローチャートである。まず、ステップ101で文書が走査され、画像データが生成される。画像データは典型的に、画像のビットマップ表現である。次いでステップ102では、画像のクリーンアップ又はテキスト及び画像のセグメンテーション等の種々のオペレーションが画像データ上で実行され得る。本発明が処理するのはテキスト部分である。ステップ103では、例えば何らかのしきい値処理方法により画像データのテキスト部分がバイナリ表現に変換されて、各ピクセルがシングルビットにより表される表現が作成される。「黒」又は「オン」ピクセルはバイナリの1で表され、「白」又は「オフ」ピクセルはバイナリの0で表されるのが典型的である。シンボルのマッチングが始まるのはこの時点においてである。
【0017】
まず、ステップ104において新たな個々のシンボルが抽出される。この好適な実施形態では、この抽出はバイナリ画像の結合されたコンポーネントの分析を介して発生する。シンボルは、水平方向ランのリストとして表される。ランは、「黒」又は「オン」ピクセルのシーケンスと定義される。次いで、抽出されたシンボルはステップ105において、抽出されたシンボルにサイズの類似する同値類の各標本に比較される。このステップはシンボル分類と呼ばれる。マッチするものがみつかると、抽出されたシンボルはステップ106において、マッチした標本の同値類に追加される。新たなシンボルがどの同値類にもあてはまらない場合には、ステップ107において新たな同値類が作成される。この好適な実施形態では、既存の同値類に追加されるシンボルの形状はすぐに捨てられ、その同値類を表す標本のみが残される。次いでステップ108では全てのシンボルに対してステップ104〜107が繰り返される。全てのシンボルが処理されると、ステップ109において、各同値類の標本の何らかの表現と各シンボルを表すべき標本の識別子と共に各シンボルの位置を含む情報が出力される。換言すれば、位置と標本識別子のペアのセットは、標本を含むディクショナリに引き継がれる。典型的には、この情報は結果的に圧縮画像となる画像のバイナリ表現よりもずっと少ない。次いでステップ110において、同値類が統合されて、より少数の同値類が作成され得る。同値類が統合されると、ステップ109で出力された標本識別子と標本ディクショナリが同値類の統合を反映するようにステップ111において修正される。
【0018】
マシンの印刷したテキストを含む走査画像は、見出されるシンボルを同値類にグループ化することにより圧縮できる。この好適な実施形態は、画像データを圧縮するシステムにおいて実行された。このシステムでは、シンボル分類子が使用されて、抽出されたシンボルを独自の標本により表される同値類に分類する。作成される同値類の数は、抽出されたシンボルをトータルした数よりも少ない。作成される出力ストリームは、標本を含むディクショナリに引き継がれる標本ID/位置のペアを含む。
【0019】
上述のように、本発明はさらに同値類のセットの統合を提供する。同値類の数の減少はさらに、ディクショナリのサイズを減少することにより画像データを圧縮する。統合を生じる方法は、シンボルが標本に比較される方法と略同じである。一般に、シンボルをマッチングする作業をより拡大すると(互いにいくらかオフセットさせようとすると)、マッチするものがより多くみつかる。効率のためには、この余分な努力をそのままのシンボルの全体的なセットに実行するのではなく、同値類の比較的小さいセットに広げるのがより効率的である。
【0020】
画像が圧縮解除されると、識別された標本の一例が指定されたロケーションに配置されるように上記ペアの各々が処理される。これは、すべてのペアに対して継続して行われる。いくらかのデータがマッチングプロセス中に消失するかもしれないので、このタイプの圧縮はLOSSY 圧縮と呼ばれる。データの消失にもかかわらず、画像の本質は残る。
【0021】
上記のように、本発明の目的は、向上されたシンボル分類子を提供することである。本発明のシンボル分類子はビットマップを分析するのではなく、シンボルを表すランを直接使用してシンボルを分類する。分類子は、分類のために幅及び高さのようなシンボル特徴を使用する。より詳細なシンボル特徴に対しては、分類子は、標本中の隣接する3つの走査線からなる対応するグループを見ることによって計算される正規の終点位置同士の対応する範囲と各シンボルのランの終点の位置を比較する。
【0022】
十分な正確さを成し遂げるために、垂直方向ランが水平方向ランから生成され、ランの両セットが分類に使用される。
【0023】
特徴ベースの分類規準は全て、ランの終点から容易に計算できる量を使用する。これらの終点の有効性により、ビットマップを用いた場合よりもシンボルの測定値の生成がずっと容易になる。特徴ベースの分類規準がシンボル分類子により如何に使用されるかを記述することにより、特徴ベースの分類規準について以下に記載する。
【0024】
シンボルの幅及び高さは、シンボルを囲む境界ボックスにより特定される。境界ボックスを用いて比較の対象とする同値類のサブセットが選択されると共に、どのシンボル特徴テストを適用すべきかが決定される。この好適な実施の形態では、同値類の標本は、比較の資格を得るにはシンボルの幅及び高さに2つのピクセルをプラスマイナスした範囲内になければならない。
【0025】
最も基本的なテストは、大きいシンボルの識別に適している。より小さいシンボルにおいては微妙な特徴が重要になるので、より多くのテストが必要となる。小さいシンボルは一般に、20個以下のピクセルの幅又は高さを有するシンボルと定義される。
【0026】
これは2つの方法で使用される。まず、非常に小さいシンボルは、幅及び高さをマッチングする比較的小さい範囲を有する。従って最小及び最大の許容幅及び許容高さが各同値類に記録される。この範囲外のシンボルは、この同値類に含められることができない。
【0027】
幅及び高さの範囲の他方の使用は、同値類の統合中に発生する。この場合も、最小及び最大の許容幅及び高さが提供されるが、この場合には同値類が統合されると範囲が変化する。同値類統合について、より詳細に以下に記載する。
【0028】
シンボルのマスは、シンボルが含有する黒ピクセルの数である。マスのチェックは、小シンボルチェックの一つである。それは主に太く標準的なフェースキャラクタの識別に使用される。2つのシンボルのマスの比が大きすぎる場合には、それらはマッチしない。除算は時間のかかるオペレーションであるので、この好適な実施形態の規準はマス同士の差に基づく。許容される差の量を求めるここでの計算は、(シンボル領域×(1+シンボル領域/256))/8である。主にシンボルのマスに基づく計算、又はシンボルのマスと領域の両方の関数に基づく計算等の他の計算も使用され得る。なお、上記式中に示される除算演算子は、全ての端数ビットが意図的に消去される整数除算である。
【0029】
内部(interior)のチェックは、小シンボルチェックの一つである。これは困難であるが、非常に小さい句読点シンボルを識別するために重要である。連結した黒ピクセルの小さな丸いしみ状のものは、大抵のものにマッチする。非常に多くのシンボルが、丸いしみから1ピクセル分プラスマイナスしたエンベロープ内にあてはまる。しかし、丸いしみは、コンマとはかなり異なる数の内部ピクセルを有する。内部ピクセルの数は、水平方向ランの数を倍にした数をマスから引いたもの(これは黒ピクセルの数から水平方向エッジのピクセルの数をマイナスすることにより大雑把に決定できる)であると定義される。これは正確ではないが、十分な近似値であり計算が容易である。2つのシンボルは、それらの内部が上記指定されたマスの差の範囲よりも異なるとマッチしない。
【0030】
小さく丸いイタリックキャラクタは、小さくて丸い非イタリックのキャラクタと見分けるのが難しい。以下に1つの例を示す。
【0031】
【外1】
Figure 0003977468
【0032】
一方のキャラクタにおける全ピクセルは、他方のキャラクタ中のピクセルに非常に近い。傾斜度は、シンボルがどれくらい傾斜しているかを測定するものとして計算される。「y」のように自然に傾斜したキャラクタもあるので、シンボルの傾斜度を用いて「このシンボルはイタリックキャラクタである」ということはできない。傾斜度を用いて2つのキャラクタを比較し、それらのキャラクタの傾斜度の差が大きすぎる場合にはそれらのキャラクタはマッチしないといえる。
【0033】
傾斜度はシンボルにおけるコーナーの数と広がりの関数として計算される。連続的な列におけるランの終点のx位置の間の差が+1又は−1となる度に、その差が傾斜度に加算される。差が+1より大きいか又は−1より小さい場合には、+2又は−2が適切であるように加算される。これは垂直方向ランに対しても実行され、傾斜が強調される。2つのシンボルは、それらの傾斜度がMIN(幅,高さ)/2よりも異なっている場合にはマッチしない。
【0034】
Bやaのように小さくて濃い略方形のものはしばしば、8やeのように小さくて濃い丸みがかったものと見分けるのが困難である。これらのキャラクタのホールは、サイズがかなり異なっている。シンボルの外部だけに基づいて測定を計算するのが最も安全である。これらのマッチしないシンボル同士がマス及び内部テストをパスした順序で、丸いシンボルは、より高さが高く若しくは幅が広く、又は高さも高く幅も広い傾向がある。
【0035】
水平方向ボリューム及び垂直方向ボリュームも同様に定義される。水平方向ボリュームは、全範囲がシンボルの幅の少なくとも7/8である列における左右の終点同士の間のピクセルの数として定義される。同様に、垂直方向ボリュームは、全範囲がシンボルの高さの少くとも7/8であるコラム(縦列)の上下の終点同士の間のピクセル数と定義される。これは丸いものよりも四角いものを優遇する。しかし、水平方向ボリューム及び垂直方向ボリュームはしばしば意味がないので、checkHVolume及びcheckVVolumeという2つのフラグが提供される。対応するボリュームが全領域の少くとも3/4である場合にフラグがセットされる。2つのシンボルのcheckHVolumeフラグの両方がセットされ、それらの幅が等しくなく、より幅の広いシンボルがより小さい水平方向ボリュームを有する(即ち非常に丸い)場合には、それら2つのシンボルはマッチしない。対応するテストが垂直方向ボリュームに適用される。水平方向ボリューム及び垂直方向ボリュームをチェックすることも、小シンボルチェックの一つである。
【0036】
シンボル分類子により実行される種々の処理ステップを記載する。
【0037】
シンボルアラインメント(整列、整合)を用いて、標本のランテンプレートグループに対するシンボルのランのマッチングに備えられる。2つのアクションがとられる。1つのアクションは、ランの軸に沿うミスアラインメント(不整列、不整合)の影響を改善しようとする。2つ目のアクションはシンボルランとテンプレートランを整列させようとするものである。
【0038】
2つのシンボルがランの軸に沿って整列されていない場合には、ケアされなければあらゆるノイズが比較ミスを生じるおそれがある。この問題を処理するために、終点の座標が変更され、重要な余剰ビットで表される。このシンボルの座標表現の変更は、ノイズに起因する寸法の変化の影響の最小化を促す。記録される水平方向ランの終点は−(実幅−1)から+(実幅−1)までの範囲をとる。これは、(実幅−1−(−(実幅−1))= 2×実幅、という計算された幅を提供する。垂直方向ランの終点は、トップの−(実高さ−1)からボトムの(実高さ−1)までの範囲を有する。
【0039】
2つのシンボルのミスアラインメントに対する最も一般的な理由は、一方のシンボルが、他方のシンボルがノイズを有さない側にノイズを有することである。これは、シンボルのうちの1つを1ピクセル分幅広く(又は高さを高く)する。しかし、これは対応するランの記録された座標を1だけ変化させる。この好適な実施の形態における最小のシンボル以外のすべてに対して、シンボルの終点と標本の終点の間に3という距離が許容される。3は、ミスアラインメントに対する1に1ピクセルだけオフするための2を加えた合計である。その測定は各ランの軸に沿ったミスアラインメントを考慮しようとする。
【0040】
行われる第2のアクションは、ランに垂直な軸においてランを整列させようとする。シンボルのランを処理するシステムを以下に詳細に記述する。手短に言えば、各標本は、マッチするシンボルの終点に対する正規の範囲を記述したテンプレートを有する。アラインメントステップがなければ、比較は常にシンボルのボトム(最下)列とテンプレートの標本のボトム列との間で行われる。標本がノイズを有さないボトムにシンボルがノイズを有する場合には、シンボルと標本は正確に整合されない。これが比較ミスにつながるおそれがある。これはさらに悪いことに、実際に違うシンボル同士がそれらのエンベロープがかろうじて近くなるようにミスアラインメントされることにつながりかねない。例えば、大文字の「I」がわずかに数字の「1」の左にミスアラインメントされると、文字「I」の上のキャップの右側が、数字の「1」と十分に異なってみえる程には伸びきらない。
【0041】
これを避けるために、シンボルの水平方向及び垂直方向の中心軸のロケーションが計算される。垂直軸のロケーションは、シンボルのエンベロープ(すなわち境界)の左右のサイドに見出されるポイントを平均することにより見いだされる。水平軸は、シンボルのエンベロープのトップの終点及びボトムの終点を平均することにより見出される。この計算は、二つの余剰ビット精度を用いて行われる(すなわち、得られる値は二進少数点未満に2ビットを有する)。次いで、シンボルの水平軸からボトムラインまで(及びシンボルの垂直軸から左サイドまで)の距離が計算される。
【0042】
新しいシンボルを任意の標本に比較する前に、シンボルの余分なボトム列及び左コラムが作成される。これらの追加された列及びコラムはそれぞれ、アラインメント列及びアラインメントコラムと呼ばれる。余分な列(コラム)は、実際のボトム(左)列(コラム)における各ランの中央と同じコラムに1つの黒ピクセルを有する。同様に、アラインメント列及びコラムは、シンボルランのチェックに使用されるテンプレートデータ構造に追加される。テンプレートのアラインメント列及びコラムに関して言えば、それらはそれぞれボトム列及び左コラムをチェックするのに使用される1セットの二重テンプレートグループの形態にある。テンプレートグループについて以下により詳細に記載する。特定のシンボルの水平方向ランの特定の標本の水平方向ランへの比較を開始する前に、水平軸とボトム列(垂直方向ランの垂直軸と左コラム)の間の距離が調べられる。シンボルの水平軸がそのボトム列に対して、標本の水平軸がそのボトム列に対するよりも少なくとも一列近ければ、シンボルのアラインメント列を用いて比較が開始される。標本の水平軸がそのボトムに対して、標本の水平軸がそのボトム列に対するよりも一列を越えて近い場合には、標本のテンプレートの二重セットを用いて比較が開始される。これによりシンボルランが標本テンプレートに合わせられる。
【0043】
ランの中央において列又はコラムに黒ピクセルを加えることは、ノイズを加えるのと同種である。シンボルのトップ及びボトムにおいてはノイズに対してだけチェックがなされる。ノイズについてチェックすることは、シンボルのピクセルが標本に対して遠く離れているかどうかを見るチェックである。アラインメント列(コラム)における各ランの中央にピクセルが1つだけ存在するので、シンボルのピクセルが標本上のいずれからも遠く離れてミスマッチを生じるようなことはあり得ない。
【0044】
この方法を用いると、エラーの減少と共に同値類の数が目立って減少することがわかった。
【0045】
これは、シンボルを同値類標本と比較する第一の方法である。大きいシンボルに対してはこれを行うだけでよい。この方法は、非常に小さいシンボルの非常に小さな差をとらえることに対しては実際のところ適切ではない(このような小さな差は小シンボルチェックによってとらえられる)。テンプレート範囲がそのような差を捕らえる程に狭くされると、かなり多くの同値類が生成される可能性がある。
【0046】
まさに同じ方法(及び同じソフトウェアコード)を用いて、水平方向標本テンプレートに対して水平方向シンボルランがマッチングされ、垂直方向標本テンプレートに対して垂直方向シンボルランがマッチングされる。水平方向ランチェックは、垂直方向エッジにおけるミスマッチの検出に用いられる。垂直方向ランチェックは、水平方向エッジにおけるミスマッチの検出に用いられる。両タイプのチェックが行われることにより、全てのエッジにおいて正確なチェックが行われることが保証される。簡潔さのために、水平方向テンプレート及び水平方向ランのチェックについてのみ記載する。垂直方向テンプレート及び垂直方向ランのチェックも同様である。
【0047】
標本をシンボルと比較する最も単純な方法は、各標本ランを1つのシンボルランと比較することである。あいにく、この方法は標本とシンボルの間の十分なバリエーションを考慮しないことが決定された。各シンボルランに対して単一の標本ランを参照するのではなく、標本の薄い3列水平方向スライスを用いて、各シンボルランに対する終点テンプレートを計算する。標本中の全ての列nに対して、列n−1、n、及びn+1を含む標本の水平方向スライスが抽出される。このスライス中の各関連するコンポーネントが1つのグループに対応する。関連するコンポーネントは、スライス中の隣接する列におけるランとオーバーラップするランのセットにより容易に識別できる。グループは、シンボルランの終点をチェックするのに使用されるテンプレートを保持するデータ構造である。
【0048】
グループのこの概念を図2で示す。図2を参照すると、1行目201は「a」のラン205、「b」のラン206及び「d」のラン207を、2行目202は「c」のラン208及び「e」のラン209を、3行目203は「f」のラン210及び「g」のラン211を、4行目204は「h」のラン212を含む。従って1行目201、2行目202及び3行目203により規定されるスライスには、2つのグループが存在する。第1のグループは、ラン「a」205、「b」206、「c」208及び「f」210により規定される。第2のグループはラン「d」207、「e」209及び「g」211により規定される。2行目202、3行目203及び4行目204により規定されるスライスに対しては、1つだけのグループが存在する。このグループは、ラン「c」208、「e」209、「f」210、「g」211及び「h」212である。
【0049】
このグルーピングの有利な点は、エッジの配置における不確かさを大目に見ることができる点である。例えば、本発明はラン「h」212により表されるエッジが1行上に移動してラン「f」210及び「g」211と結合することを許容する。従ってグルーピングは、水平方向グループが垂直方向のノイズを許容し、垂直方向グループが水平方向のノイズを許容することを可能にする。別の例としては、薄壁を有する10×10の円の左右のサイドは画像中でつながっているが、円の中央を通る3列スライスが、連結された2つの異なるコンポーネントを含むので、それらは個々のグループを有する。トップにおける3列スライスは、1つの関連するコンポーネントを有するので、1つのグループである。しかしながら、3列の高さ(又は3コラム分の幅)未満のホールの回りの全ての水平方向3列スライスは、単一の関連するコンポーネントを有するので、ここに1つのグループが生成される。
【0050】
各テンプレートグループは特定のタイプからなる。4つのタイプのテンプレートグループがある。グループのタイプにより、どの種類のチェックが行われるかが決まる。チェックが失敗すると、シンボルと標本は上記のことを除いてマッチしない。4つのテンプレートグループタイプを以下に記載する。
【0051】
CheckNoise:
このタイプは、標本のエッジで使用される。標本のピクセルの最終ラインは、マッチングシンボル中に存在するかもしれないし、存在しないかもしれない。同様に、標本のエッジのすぐ隣の空白は、その中にマッチングシンボルからのビットを有し得る。CheckNoiseグループの目的は、シンボルランがCheckNoiseグループによりカバーされる範囲と交差する場合に、全体のシンボルランがその範囲内に含まれることを保証することである。それ自身のCheckNoiseグループに適する標本エッジの最小レングスを特定するパラメータが存在する。さらに、所与のポイントの右のシンボルランだけがチェックされることにより、このグループはCheck1RunNoAdvance規準(後述する)と共に後で使用され得る。
【0052】
Check1Run :
これは、最も一般的なグループである。これは、対象とする領域の3本の走査線の各々において標本が正確に1つのランを有する場合に使用される。これは、左右の終点の値の範囲を含む。左終点の範囲は、3つのランの最も左の左終点と3つのラインの最も右の左終点との間である。次いで、或るスロップ(slop)が追加される。左におけるスロップのサイズは、シンボルサイズと最も左の終点が標本のラインに属するかどうかとの関数である(中間のラインに対してはより多くのスロップが許容される)。右の終点範囲も同様に計算される。
【0053】
時に、シンボルは中央の走査線上に2つのランを有し得る。これは、標本を作成するのに使用される一例のシンボルが閉(つまった)ループを有するが他のシンボルは有さない場合に発生する。分類は主にシンボルのエンベロープの形状に関係するので、この差によって比較ミスは発生しないはずである。従って、上記規準が失敗すると、CheckEndpointsテストが実行される。
【0054】
CheckEndpoints:
このテストは、1つのグループの3つの列のいずれかの上に1つより多くランが存在する場合に用いられる。範囲内に含まれるランのブロックの最も左の端及び最も右の端が正しい場所にあるかについてチェックが行われる。これは、小さいホールの有無が重要でないとする考え方と一致する。これはまた、標本におけるフォーク(分岐)及びジョイント(連結)を上下に移動させる。最も左の終点と最も右の終点の範囲は、Check1Run において行われる方法と同様に決定される。
【0055】
Check1RunNoAdvance:
このグループタイプは特別なケースを扱う。これは、現行のシンボルランを越えて進行しないことを除けばCheck1Run グループと同じである。この特別なケースを以下に示す。
【0056】
垂直方向ストロークは、垂直方向に隣接する水平方向ランの集まりと定義される。同様に水平方向ストロークもあるが、垂直方向ストロークを説明する目的でそれについては考慮しないことにする。ストロークの各列には正確に一つのランがある。非常に小さいシンボルのループにおいては、1つのみランを含むストロークにより2つの垂直方向ストロークがトップ又はボトムにおいて連結され得る。ランの正確な位置は、それが実際にストローク同士の間のギャップにわたらなければ重要でない。この場合、CheckNoiseグループが用いられてギャップの右のノイズが放棄され、Check1RunNoAdvanceグループが用いられてギャップを覆うランがあるかどうかが調査され、別のCheckNoiseグループによりギャップの上/下のラインの右端の右にあるランが放棄される。したがって、ノイズブリップは、ギャップの右及び/又は左に対してチェックされると共に許容され、CheckNoiseグループはギャップをまさにカバーする単一のラン、又はギャップの上/下のライン近くの全てのスペースをカバーする単一のランをチェックする。
【0057】
以下により詳細に記載するように、上述のタイプの1セットのテンプレートグループが生成され、その後標本とシンボルの比較に使用される。テンプレートグループのセットは、マッチが発生する場合に満たされなければならない1セットのマッチング規準を定義する。このマッチング規準は、同値類及びその標本に唯一のものであり得る。比較中に、テンプレートグループとシンボルランの両方が右から左、下から上へと処理される。1つのテンプレートグループは複数のタイプからなるように規定できるので、各テンプレートグループは、1つ以上のシンボルランをチェックするように使用される。グループの余剰セットが標本のトップより上に生成されると、シンボルのトップにおけるノイズが捕えられる。すべての標本グループが失敗することなくチェックされると、残りのシンボルランの数がチェックされる。左にシンボルランが存在する場合には、シンボルと標本はマッチしない。ランの水平方向セットと垂直方向セットの両方がマッチする場合には、シンボルと標本はマッチする。
【0058】
上記チェックが十分でないこともある。注意されるべき特定的な問題は、小さい太字の「e」と小さい太字の「a」である。これら両者は傾向として、つまり気味で丸みがかっている。人は、比較的大きな特徴(差)を比較的小さい特徴にあてはめることによりこれを扱う。小さくて濃い丸いものを比較する場合には、別の、即ちより敏感なテストが用いられる。シンボルの終点が標本により特定される範囲内にあるかどうかを決定するばかりでなく、シンボル同士が実際には同じでないことを示すようにシンボルの終点が範囲内で移動していないかを決定することが意図される。
【0059】
例えば、「a」は「e」よりも少し方形であり、左に小さなくぼみを有する。「a」の左のエッジは、(ボトムにおいて)「e」の左のエッジよりも左にあると共に、(中央においては)「e」の左のエッジより右にある。しかしながら、シンボルと標本における相関性のないノイズをシンボルと標本が互いに放棄することもできる。
【0060】
シンボルの左サイド及び右サイド(又は垂直方向ランを見る際にはトップ及びボトム)に対して別々に計算が実行される。両サイドに対する計算は同じであるので、左サイドの計算に関してのみ記載する。各列において、シンボルの最も左の終点(Sとラベル付けされるコラム)と標本の最も左の終点(Eとラベル付けされるコラム)の間の距離が決定される(EΔとラベル付けされるコラム)。なお、シンボルSの終点と標本Eの終点は常に、上述のアラインメントプロセスにより2の倍数である。これらの間の距離の差は、隣接するライン(EΔ−PΔとラベル付けされるコラム)において計算される。これは、最初の誘導体のようなものである。変数Pは、先行する0でない距離(即ちEΔ−PΔのインスタンス)を保持するように維持される。この変数は、比較プロセスの開始時に0(ゼロ)に初期化される。距離のこの差(すなわちEΔ−PΔ)がゼロでない時毎に、(P+この差)の絶対値が差の実行中の合計に加算され、次いでPが新たな差に取り替えられる。右サイドのトータルか左サイドのトータルのいずれかが高さの3/4(垂直方向ランを比較する際には幅の3/4)より大きい場合には、シンボルと標本はマッチしない。
【0061】
【表1】
Figure 0003977468
【0062】
この計算の一例について表1を参照して説明する。表1の種々のコラムは、上述の情報を含む。表1の合計の更新というコラムは、合計値が更新されるべきかを示すと共に、記述の目的で提供される。EΔ−PΔの値が0でない場合には、合計が更新されることを思い起こしていただきたい。
【0063】
表1の列1は、分析される最初の列を例証する。処理の開始時にPΔ及びPの値はゼロに初期化される。EΔ−PΔが0ではないので、合計は変更される。結果的に、合計フィールドが3という値をとることになる。
【0064】
列2では、シンボル及び標本の終点が動かないのでEΔ−PΔ=0である。従って、合計に変化は生じない。値Pは列1からのものである。
【0065】
列3では、標本の終点Eが移動され、EΔが1という値になる。EΔ−PΔがゼロでない(−2)ので、合計の更新が示される。値Pは列1からのものである。よって、(EΔ−PΔ)+P=−2+3は1であり、これが合計に加算されて4という値が得られる。
【0066】
列4では、標本の終点は、列1及び列2にあった場所に戻る。EΔ−PΔが0でないので、合計の更新が示される。値Pは列3からのものである。しかし、(EΔ−PΔ)+P即ち(−2+2)の絶対値はゼロであるので、合計に対して有効な変化が生じない。
【0067】
列5では、標本の終点は列3にあった場所に戻る。EΔ−PΔが0ではないので、合計の更新が示される。値Pは列4からのものである。しかし、この場合には(EΔ−PΔ)+P(即ち、−2+2)は0であるので、合計に有効な変化は生じない。
【0068】
列6では、シンボルの終点と標本の終点が等量移動する。Pは列5からその値を得る。EΔ−PΔが0であるので、合計に変化は生じない。
【0069】
列7では、標本の終点が移動する。これは結果的に−1というマイナスのEΔに帰結する。Pは列5からの値を保持する。値EΔ−PΔ=−1−1=−2であり、合計に加算される値は(EΔ−PΔ)+P=−2−2=−4の絶対値の4であり、これが合計に加算される。次いで合計は8の値をとる。
【0070】
列8では、標本の終点が再び動く。これは、−3というマイナスのオフセットEΔに帰結する。値Pは列7からのものである。EΔ−PΔ=−3−1=4であり、合計に追加される値は(EΔ−PΔ)+P=−4−2=−6の絶対値である6である。合計は14というの値をとる。
【0071】
このように作用すると、2つのシンボルが完全にミスアラインメントされる場合には終点の距離は全てこの同じミスアラインメント距離に等しいので、差は全く記録されず、合計には何も追加されない。関連のないノイズは、その差を+1、−1、+1、−1等のように見せる傾向がある。各ペアの合計は0であるので、不規則変動は行われない。一方、実際の変動は少くとも2つのステップに対して同じ方向に生じる傾向があるので、発現する。
【0072】
これを実施するために、標本の最も左端と最も右端にタグが付けられる。タグがセットされると、グループの中央のライン上の標本ランとシンボルランとの差が計算される。標本が小さくて丸く濃いシンボルを表す場合にのみフラグがセットされる。
【0073】
分類に使用される個々のテストについて記載した。ここではテストが実行される順序を記載する。先に述べたように、シンボル抽出ステップは、画像中のすべての関連するコンポーネント、又はシンボルを見出す。見出された各シンボルに対して、シンボル−ファインダ(symbol-finder )がシンボルのロケーション、境界ボックス、及びシンボルを含むランのリストを用いる分類ルーチンを呼び出す。
【0074】
図3は、分類ルーチンのステップを概説するフローチャートである。まず、入力される水平方向ランの座標が、(1)シンボルの中心に対して、(2)2を乗じられたオフセットを有するように、ステップ301において変更される。これにより、上記2つのステップにおいて−(幅−1)から+(幅−1)までの範囲をとるシンボルランが生成される。次いで、シンボルのマス及び内部がステップ302において計算される。ステップ303においてシンボルのボトムに対してアラインメント列が作成される。これは、ボトムの走査線における水平方向ランから水平方向ランの二重セットを計算することにより行われる。これらは、各実際の水平方向ランの中央のコラムに単一の黒ピクセルを有するランである。上述のように、アラインメント列は、必要であればシンボルを垂直方向(上)にオフセットするように用いられ得る。
【0075】
ステップ304では、シンボルの垂直方向ランが水平方向ランから計算される。垂直方向ランも、シンボルの中央に中心を置く2×座標を使用する。次にアラインメントコラムがステップ305で作成される。ここで、左コラムにおいて垂直方向ランから垂直方向ランの二重セットが作成される。これらは、各実際の垂直方向ランの中央の列に一つの黒ピクセルを有するランである。それらは、必要であればシンボルを右にオフセットするように用いられる。
【0076】
次に、ステップ306においてシンボル特徴が計算される。先に述べたように、これらの特徴は、傾斜(度)、水平方向ボリューム及び垂直方向ボリューム、水平方向中心軸からシンボルのボトムまでの距離、そして垂直方向中心軸から左コラムまでの距離を含む。また、ステップ307では水平方向ボリューム及び垂直方向ボリュームが決定され、必要であればボリュームフラグがセットされる。対応するボリュームが全領域の少くとも3/4であれば、フラグがセットされる。これらフラグは、小さくて濃いシンボルのチェックを補助する。
【0077】
次いでステップ308において、シンボルとの比較に適格な標本テンプレートがディクショナリから識別される。上述のように、標本は、比較が行われるために抽出シンボルの2つのピクセルの範囲内の高さ及び幅を有さなければならない。標本テンプレートは、幅及び高さによりグルーピングされる。表2は、標本が比較されるシーケンスを示す。「w」及び「h」のコラムの下に与えられる数はそれぞれ、シンボルの幅及び高さからのオフセットである。例えば、標本の第1のグループはシンボルと同じ幅及び高さを有する。調査される標本の第2のグループは、シンボルよりも1だけ幅が広い、等。所与の幅及び高さのグループの全標本は、シーケンスにおける次のサイズグループの標本を見る前に調査される。
【0078】
【表2】
Figure 0003977468
【0079】
ステップ309においてディクショナリが空であること又はその範囲に標本がないことが決定されれば、ステップ318において新たな同値類が作成される。最初のチェックは、シンボルの幅及び高さとシンボルの傾斜特徴が標本のしきい値内にあるかどうかをステップ311で決定することである。標本は、シンボルの高さ及び幅に対する最小値及び最大値を規定する。傾斜のしきい値は、MIN(幅、高さ)/2という関数により定義される。これらの特徴が標本のしきい値の範囲内になければ、それが比較に適格な最後の標本であったかどうかのチェックがステップ312において行われる。最後の標本でなければ、次の標本がステップ310で読み出される。それが最後の標本であれば、新たな同値類がステップ318で作成される。新たな同値類を作成するステップ318については、標本テンプレートを参照して後述する。
【0080】
シンボルの幅及び高さと傾斜特徴が標本のしきい値の範囲内であれば、小さいシンボル(即ち大きくないこと)に関する検査と小シンボルチェックがステップ313で実行される。小さいシンボルに関する検査は、シンボルの高さ及び幅が20ピクセル以下であるかどうかである。これにより、小さいシンボルに対する特別なチェックが幅の狭い又は偏平なシンボルに実行されることができる。小シンボルチェックについては図4を参照してより詳細に、及び大きいシンボルに実行されるチェックに追加して説明する。シンボルが小さく、小シンボルチェックのいずれをもみたさない場合には、標本とマッチするものはなく、ステップ312において処理は可能であれば別の標本を試行し続ける。
【0081】
シンボルが大きいか、又はシンボルが小さいと共に全ての小シンボルチェックをパスした場合には、ステップ314においてテンプレートグループ規準にマッチングするシンボルランが見出される。先に述べたように、標本テンプレートは、各々が特別なマッチ規準を有する水平方向及び垂直方向テンプレートグループを含む。テンプレートグループを使用するこのプロセスについては、さらに図5を参照して説明する。次いでステップ315では、標本テンプレートがマッチされるかどうかが決定される。マッチするものが生じなければ、処理はステップ312で可能であれば別の標本を試行し続ける。マッチするものが生じれば、シンボルの位置及びマッチングした標本のIDがステップ316で記録される。最後に、標本テンプレートに対するマッチカウンタがステップ317で増分される。後述するように、マッチカウンタは同値類統合中に使用され、統合された同値類を表現するのにどの標本が使用されるべきかを決定する。
【0082】
図3に記されるステップは、画像から抽出される各シンボルに対して繰り返される。
【0083】
図4は、小シンボルチェックを示すフローチャートである。これらのチェックについては図3のステップ313で言及した。概して、これらのチェックはシンボル特徴を標本しきい値と比較する。なお、小さく濃いシンボルに対する更なるチェックは、テンプレートグループとシンボルランの比較に関して実行され、これについては図5を参照して説明する。図4では、以下のチェックが小さいシンボルに実行される。
【0084】
ステップ401では、シンボルのマスが標本により指定される範囲内にあるかどうかのチェックが行われる。2つのシンボルはそれらのマスの比が大きすぎる場合にはマッチしない。大きすぎる場合には、図3のステップ312で次の標本が試行される。大きすぎない場合には次のチェックが実行される。
【0085】
ステップ402ではシンボルの内部が標本により特定される範囲内にあるかどうかのチェックが行われる。2つのシンボルはそれらの内部がマスの範囲を越えて異なる場合にはマッチしない。内部がマスの範囲を越えて異なれば、図3のステップ312で次の標本が試行される。
【0086】
次いで、残りのチェックは小さく濃いシンボルに使用される。濃さの指標は、HVolume 又はVVolume フラグのセットである。
【0087】
ステップ403では、シンボルのcheckHVolumeフラグ又は標本のcheckHVolumeフラグがセットされたか、及びシンボルと標本が同一の幅でないか、及びそれらのうちの幅の広い方がより小さいHVolume を有するかのチェックが行われる。そうである場合には、図3のステップ312で次の標本が試行される。そうでない場合には、次のチェックが実行される。
【0088】
シンボルのcheckVVolumeフラグ又は標本のcheckVVolumeフラグがセットされ、及びシンボルと標本が同一の高さでないか、及びそれらのうちの高さの高い方がより小さいVVolume を有するかのチェックがステップ404で行われる。そうであれば、図3のステップ312で次の標本が試行される。そうでない場合には、すべての小シンボルチェックがパスされ、標本のテンプレートグループ規準の分析が図3のステップ314で実行される。
【0089】
テンプレートグループをシンボルとマッチングするプロセスは、水平方向/垂直方向テンプレートグループと水平方向/垂直方向シンボルランの両方に対して同一である。従って、図5のフローチャートで記述されるステップは、水平方向及び垂直方向ランに対して適用される。なお、図5はまた、小さくて濃い丸いシンボルをチェックするための更なるステップについても記述する。図5を参照すると、最初のステップは、シンボルの水平方向/垂直方向軸とそのボトム列/左コラムとの間の距離(値Xと呼ぶ)と標本の水平方向/垂直方向軸とそのボトム列/左コラムとの間の距離(値Yと呼ぶ)を決定する。これらの測定は、アラインメント列/コラムがシンボル又は標本に付加されるかどうかを決定するために使用される。ステップ502でX−Y≧1が真であれば、ステップ503でアラインメント列/コラムがシンボルに付加される。換言すれば、水平方向ランの場合、シンボルの軸がそのボトム列に対して、標本の軸がそのボトム列に対するよりも少なくとも一列近ければ、シンボルのアラインメント列を用いてシンボルが標本と整合され始める。逆にステップ504でY−X≧1が真であれば、ステップ505でアラインメント列/コラムが標本に付加される。換言すれば、標本の軸がそのボトム列に対して、シンボルの軸がそのボトム列に対するよりも少なくとも一列近ければ、標本のアラインメント列を用いて開始される。なお、これはシンボルのボトム列を標本にマッチングするのに使用されるテンプレートグループの二重セットに対応する。
【0090】
処理は、各標本のボトム列、右コラムにおいて始まるテンプレート及びシンボルランを用いて進行する。ステップ506でテンプレートグループが得られる。次いでステップ507において、シンボルランリスト中の現行のラン(単数又は複数)がテンプレートグループ規準にマッチするかどうかが決定される。先に述べたように一つより多くのランがテンプレートグループの規準にマッチすることを要求されることができ、マッチ規準はグループのタイプにより特定される。テンプレート規準がランリスト中のランによって満たされない場合には、処理は図3のステップ312において次の標本を得るように継続する。ステップ508において規準が満たされる場合には、テンプレートグループにマッチングするランが消費され、ランリスト中の次のランがステップ509で現行ランとなる。これにより、すべてのランが標本の或るテンプレートにマッチすることが保証される。シンボルが小さく、丸く、濃い場合には、ステップ510においてアラインメント及びノイズチェックが列に対して実行される。このチェックは、現行列がゼロでない隣接列オフセットを有する際の隣接列オフセットの差の集積であり、これについては表1を参照して上述した。
【0091】
ステップ511では、より多くのテンプレートグループがチェックされる必要があるかどうかが決定される。そうである場合には、処理はステップ506で継続する。そうでない場合には、シンボルランリストが使用されきったかどうかがステップ512において決定される。そうでない場合には、マッチするものが発生しなかったので、処理は図3のステップ312で次の標本を得るように継続する。小さく、丸い、濃いシンボルの場合、ランリストが消費されきった場合には、集積されたオフセットの差が所定のしきい値よりも大きいかどうかがステップ513で決定される。この好適な実施の形態では、所定のしきい値は、高さの3/4(垂直方向ランを比較する場合には幅の3/4)である。小さくて丸く濃いシンボルでない場合、又は所定のしきい値が越えられない場合には、マッチが発生し、処理は図3のステップ316においてシンボルをコード化するように継続する。しきい値を越える場合には、処理は図3のステップ312において次の標本を得るように継続する。
【0092】
シンボルの抽出及びマッチングプロセスの間に、シンボルがどの標本にもマッチしないこともある。この場合には、新しい同値類が作成される。新しい同値類の標本は、抽出されたシンボルである。新しい同値類が作成されると、新しい標本にシンボルをマッチングすることを要求されるテンプレートが作成される。幸いにも、テンプレートに使用されるシンボル特徴の多くは、分類プロセス中に作成されたので、再計算される必要がない。新たな標本は、その後のシンボル分類のために標本リスト(すなわちディクショナリ)に挿入される。検索が楽なように、標本は標本を定義する境界ボックスのサイズによりインデックスを付けられる。
【0093】
標本テンプレートは、シンボルを標本にマッチングすることを必要とされるすべてのデータを含む。図6は、標本テンプレートの基本構成要素を示す。図6を参照すると、標本テンプレートは、標本ID番号601と、マッチカウント602と、標本特徴パート603と、標本フラグ604と、しきい値範囲605と、種々のランポインタ606とを含む。
【0094】
標本ID番号601は、標本テンプレートにアクセスするためにシンボル分類子により使用されるインデックスである。
【0095】
マッチカウント602は、標本にマッチングするシンボルの数を含む記憶場所である。
【0096】
標本特徴パート603は、幅及び高さ情報、標本中の1(黒ピクセル)の数、標本の傾斜、内部ピクセルの数、水平方向ランから計算されるアシメトリ(非対称性)、垂直方向ランから計算されるアシメトリ、水平方向ランから計算されるボリューム(各走査線上の最も左の終点と最も右の終点との間に含まれるピクセルの数の合計)、及び垂直方向ランから計算されるボリューム(垂直方向ランに対する各走査コラムにおけるトップとボトムの間に含まれるピクセルの数の合計)を含む。
【0097】
標本フラグ604は、小さく濃いシンボルに対するチェックに使用されるHVolume 及び VVolumeフラグを含む。
【0098】
しきい値範囲パート605は、種々のシンボルと標本特徴を比較するしきい値を含む。なお、他のしきい値範囲は実際のシンボル分類処理の間に計算される。
【0099】
ランポインタパート606は、テンプレートを用いて抽出シンボル中のランをチェックするのに使用される水平方向及び垂直方向テンプレートグループのリストに対するポインタと、対応する標本を定義するランに対するポインタとを含む。
【0100】
すべての画像シンボルを標本と比較した後、あまりに多くの同値類が存在する可能性がある。それにはいくつかの原因がある。第一は、比較における共有( communitivity)の不足である。シンボルAが標本Bにマッチしないことがわかっても、標本Bにより表されるシンボルがシンボルAに対する標本にマッチするかどうかはわからない。シンボルBが第1でシンボルAが第2であることがわかると、実際には併合されるべき2つの標本が作成され得る。同値類超過の別の原因は、ミスアラインメント(不整列)である。ランの軸に沿うミスアラインメントを許容すると共に正確な走査線とマッチングしようとする試みがなされるが、それは必ずしもうまくいかない。
【0101】
同値類を合併する結果生ずる同値類は、統合同値類と呼ばれる。同値類の統合は少なくとも4つのケースを考慮に入れる:
1.統合同値類のメンバでない2つの独立した標本同士がマッチする。この場合、新しい統合同値類が生成される。
2.孤立した標本が、すでに統合同値類のメンバである標本にマッチする。この場合、孤立した標本が既存の統合同値類に追加される。
3.すでに統合同値類のメンバである標本が、孤立した標本にマッチする。この場合、孤立した標本が既存の統合同値類に追加される。
4.すでに2つの異なる統合同値類のメンバである2つの標本同士がマッチする。この場合、2つの既存する統合同値類が併合され、2つの元々の統合同値類のメンバを含む新たな統合同値類が生成される。
【0102】
同値類統合の際には、別の同値類の少くとも1つのメンバにマッチする或る同値類の少くとも1つのメンバを見出すことにより、同値類同士が合併される。マッチが正確でないので、推移性(移行性)に関する何らかのトラブルが発生する。すなわち、シンボルAはシンボルBにマッチし、シンボルBはシンボルCにマッチするが、シンボルAはシンボルCにマッチしないかもしれない。かなり拡張されると、不正確な同値類同士につながりが存在するので、同じ同値類中にかなり異なるシンボル同士が存在し得る。
【0103】
この好適な実施の形態では、推移性の問題は、併合される各同値類の許容サイズ範囲を、併合している同値類の範囲の交わりに制限することにより最小にされる。これは、或る同値類のシンボルが他の同値類のいずれのシンボルにも類似することを保証する。サイズ範囲が制限されると、他のテストは、大きな差の防止に対して十分に正確である。なお、他のテストはマスの許容範囲を提供すること等のアドレス指定にも使用され得るが、サイズの許容範囲に対する制限が大抵のケースを処理することが決定した。
【0104】
さらに、同値類統合中に個々のシンボルを比較する際、第1のシンボルの同値類中に見出されるシンボルの寸法の範囲が第2のシンボルの同値類により許容される範囲と比較される。第1の同値類中のすべてのシンボルが第2の同値類において指定される範囲内に合わなければ、2つのシンボルはマッチすることができない。同様に、第2の同値類中のすべてのシンボルが第1の同値類において指定される範囲内に合わなければ、2つのシンボルはマッチすることができない。
【0105】
同値類を統合する時には、それらのうちどれが新しい同値類の標本になるかが決定されるまで、すべての同値類標本が保持される。或る同値類の標本が別の同値類の標本にマッチすれば、それらの同値類は統合される。分類プロセスの特徴は、2つのシンボルがすでに同じ同値類のメンバである場合にはそれら2つのシンボルは比較されないことである。
【0106】
図7及び図8は、この好適な実施の形態の同値類統合を述べたものである。図7は、本発明のこの好適な実施形態における同値類統合の基本ステップを概説するフローチャートである。図7を参照すると、標本はまずステップ701で「シフトされない」位置において他の標本とマッチングされ、統合同値類が作成される。なお、ここでは各標本は統合同値類中にセーブされる。「マッチする」とは、セット中の標本が全て、セット中の少なくとも1つの他の標本にマッチしたとの意味である。使用されるマッチング方法は、上述のシンボル分類子のものと同じである。図8に関して後述するように、マッチングの規準は、より多くの標本がマッチングされる程、より厳しくなる。なお、各標本は正確に統合された1つの同値類に属する。
【0107】
マッチするものの最大数を見出すために、標本がシフトされる。「シフトされる」とは、全ランの終点が変更されるという意味である。まず、ステップ702において標本が右にシフトされて他の標本にマッチングされ、次いでステップ703において上にシフトされて他の標本に比較される。ステップ701〜703は、マッチされる標本の複数のセットを得るためにステップ704において全ての標本に対して繰り返される。
【0108】
標本が統合同値類に一旦合併されると、ステップ705においてその統合同値類に対する標本となるように標本の中から1つの標本が選択される。この好適な実施の形態では、これは累積されたマッチスコアにより決定される。先に述べたように、各同値類テンプレートはマッチカウントを有している。このマッチカウントは、標本にマッチすることがわかったシンボルの数に対応する。同値類の統合中に2つの標本がマッチすることがわかると、各標本は、他の標本のマッチカウントを受け継ぐ(即ち、他の標本のマッチカウントがそれらのマッチカウントに追加される)。最も高いマッチカウントを有する標本が、その同値類を表す標本となる。本発明の主旨及び範囲を逸脱しなければ、マッチカウントの重みづけ平均等の他の方法を使用することもできる。
【0109】
最後にステップ706において、処理されるシンボルを含むデータストリームが、新たな統合同値類を反映するように変更される。これは、出力データストリーム中の標本IDを実際に変更することにより、又は画像は再生される時に使用される平行移動表を提供することにより、達成されることができる。またこれは、新たな同値類をディクショナリとして提供することも含む。
【0110】
図8は、図7のステップ701〜703で実行される標本のマッチングステップを概説するフローチャートである。このプロセスを説明する目的で、図8は標本Aと標本Bを使用する。標本Aは、他の標本に比較されている標本である。標本Bは、標本Aに比較されている標本の一例を表す。標本A及びBの両者は、孤立した標本、又は統合同値類の一部である標本であり得る。前者の場合、図8中に挙げられる値/範囲は、その標本の値/範囲のことである。後者の場合、図8に挙げられる値/範囲は、統合同値類の値のことである。さらに、各標本は、2つの指定されたサイズ範囲、即ち実際のサイズ範囲と許容されるサイズ範囲を有する。実際のサイズ範囲は、標本又は統合同値類中の標本(複数)に対する実際のサイズ又はサイズ範囲を示す。許容サイズ範囲は、標本にマッチすることのできるサイズの許容範囲を表す。
【0111】
図8を参照すると、まずステップ801において、標本Bの実際のサイズ範囲が標本Aの許容サイズ範囲内にあるかどうか、及び標本Aの実際のサイズ範囲が標本Bの許容サイズ範囲内にあるかどうかが決定される。上述したように、これらのサイズチェックにより推移性の問題が処理されることが決定された。
【0112】
ステップ802の「サイズはOK」がノーであれば、ステップ803において同じ同値類中にまだ存在しない次の標本が比較され、処理はステップ801で再開する。ステップ802の「サイズはOK」がイエスであれば、ステップ804において標本Aが標本Bに比較される。比較ステップは、シンボル特徴がそれぞれの標本テンプレート内に含まれるのでそれらを計算する必要がないことを除いて、上述の比較ステップと同じである。ステップ805の「マッチする」がノーであれば、同一の統合同値類中にまだ存在しない次の標本がステップ803で比較され、処理はステップ801で再開する。
【0113】
ステップ805の「マッチする」がイエスである場合には、ステップ806で標本Aが標本Bと合併される。合併により、上述した種々の組み合わせに対応する統合同値類、即ち新たな統合同値類が得られたり(標本A及び標本Bは両者とも孤立した標本である場合)、それら標本のうちの1つが既存の統合同値類に併合されたり(標本A又は標本Bのいずれかが既存の同値類中にある場合)、あるいは2つの統合同値類が併合されたりする(標本Aと標本Bが両者とも既存の統合同値類のメンバである場合)。
【0114】
次いで、統合同値類の実際のサイズ範囲及び許容サイズ範囲は、ステップ807において標本B(又は使用される標本Bが帰属すべき統合同値類)を考慮するように変更される。その結果、2つのサイズ範囲が次のように変更される:(1)同値類中の実際のサイズは典型的に、標本が追加されるためにより大きくなる;(2)新たな同値類にマッチングする許容サイズ範囲は、2つの合併される同値類に対して許容される範囲の交わりであるので、典型的により小さくなる。
【0115】
前述の例に関して同値類統合をさらに説明する。ABCDEFGHという8つの同値類標本を有すると仮定する。
【0116】
まず、同値類Aは同値類B、E及びGとマッチすると仮定すると、(A,B,E,G)CDFHが得られる。従って、表される同値類のセットが5つのみ存在し、(A,B,E,F)は統合同値類となる。比較は各標本に対して繰り返される、即ち、同一セット中の標本同士は比較されないことを除いて、同値類B〜Hは全て他に比較される。同値類CとFがマッチし、同値類D及びHは他のどの同値類にもマッチしないと仮定する。これにより、(A,B,E,G)(C,F)DHが得られる。従って、(C,F)も統合同値類となり、4つのみの同値類が存在することになる。統合同値類に対して、同値類を表す標本の選択が残る。ここで、最も累積したシンボルマッチを有するものが代表者となる。従って例えば、標本Aが50個のマッチを有し、Bが40個のマッチを有し、Eが46個のマッチを、そしてGが20個のマッチを有する場合には、標本Aがその同値類を表すことになる。
【0117】
本発明のこの好適な実施形態が使用され得るコンピュータベースシステムについて図9を参照して説明する。図9を参照すると、コンピュータベースシステムは、バス901を介して接続される複数のコンポーネントを含む。ここで示されるバス901は、本発明を不明瞭にしないように単純化されている。バス901は、複数の並列バスから成る(例えばアドレスバス、データバス、状態バス)かもしれないし、複数のバスの階層構造(例えばプロセッサバス、ローカルバス、及びI/Oバス)であるかもしれない。いずれにせよ、コンピュータシステムはさらに、内部メモリ903からバス901を介して提供される命令を実行するプロセッサ902を含む(なお、内部メモリ903は典型的にはランダムアクセスメモリ又は読出し専用メモリの組み合わせである)。かかる命令は、図1〜図5と図7及び図8のフローチャートで概説された処理ステップを実行するソフトウェア中で実行されるのが好ましい。プロセッサ902及び内部メモリROM903は、別々のコンポーネントであっても、アプリケーション指定集積回路(ASIC)チップ等の単一の集積デバイスであってもよい。
【0118】
またバス901には、英数字入力のためのキーボード904、データ格納のための外部記憶装置905、カーソル操作のためのカーソル制御デバイス906、及びビジュアル出力をディスプレイするためのディスプレイ907も接続される。キーボード904は典型的に、標準のQWERTYキーボードであるが、電話のようなキーパッドであってもよい。外部記憶装置905は、固定された又は取り外し可能な磁気若しくは光ディスクドライブであってよい。カーソル制御デバイス装置906は典型的に、ある種の機能の実行をプログラムできるボタン若しくはスイッチを有する。さらに、スキャナ908もバス901に接続される。スキャナ908は、媒体(すなわち走査文書画像)のビットマップ表現を作成する手段を提供する。
【0119】
バス901に接続されることのできる任意のエレメントは、プリンタ909、ファクシミリエレメント910及びネットワークコネクション911を含む。プリンタ909はビットマップ表現を印刷するのに使用できる。ファクシミリエレメント912は、本発明を用いて圧縮された画像データを伝送するのに使用されるエレメントを含み得る。あるいはファクシミリエレメント912は、本発明を使用して圧縮された文書画像を圧縮解除するエレメントを含んでもよい。ネットワークコネクション911は、画像データを含むデータの受信/伝送に使用される。従って本発明により使用される画像データは、走査プロセスを介して、又は受け取られたファックスを介して、又はネットワーク上で得られることが可能である。
【図面の簡単な説明】
【図1】本発明の好適な実施形態で実行され得る、走査されたシンボルを同値類に分類するステップのフローチャートである。
【図2】標本の薄い水平方向スライスから作成されるランのグループを示す図である。
【図3】本発明の好適な実施形態で実行され得るシンボル分類のステップを概説するフローチャートである。
【図4】本発明の好適な実施形態において実行され得る小シンボルチェックのステップを概説するフローチャートである。
【図5】本発明の好適な実施形態において実行され得るテンプレートグループ/シンボルラン比較ステップを概説するフローチャートである。
【図6】標本テンプレートのコンポーネントを示すブロック図である。
【図7】本発明の好適な実施形態において実行され得る同値類統合の基本ステップを概説するフローチャートである。
【図8】図7で記述された統合同値類を作成するための標本のマッチングステップのサブステップを概説するフローチャートである。
【図9】本発明の好適な実施形態が使用され得るコンピュータベースシステムのブロック図である。
【符号の説明】
901 バス
902 プロセッサ
903 内部メモリ
904 キーボード
905 外部記憶装置
906 カーソル制御デバイス
907 ディスプレイ
908 スキャナ
909 プリンタ
910 ファクシミリエレメント
911 ネットワークコネクション

Claims (2)

  1. バイナリ符号化された画像データ中に含まれるシンボルを分類する装置であって、
    プロセッサと、
    走査手段と、
    記憶手段と、
    を備え、
    前記プロセッサは、
    a) 前記走査手段によって走査され、前記記憶手段に記憶されたシンボルのランレングス符号化表現を抽出
    b) 前記抽出されたシンボルのシンボル特徴を前記ランレングス符号化表現から決定
    c) 前記抽出されたシンボルと比較することができる同値類のセットを前記記憶手段に記憶されている同値類のリストから選択、該リストが以前に抽出されたシンボルから作成された同値類を含み、各同値類がテンプレートを含み、該テンプレートが前記同値類を表す標本にマッチングするための情報を含み、
    d)マッチするものが見出されるまで、又はマッチするものがない場合には全ての標本が比較されるまで、前記テンプレートを用いて前記セットの同値類の各々の標本と前記抽出されたシンボルを比較、該比較が、
    d1)第1セットのシンボル特徴が、比較されている標本のテンプレートにおいて特定される対応するしきい値範囲内にあるかどうかを決定
    d2)前記第1セットのシンボル特徴のいずれかが前記しきい値範囲内にない場合に、抽出されたシンボルが比較されている標本にマッチしないことを示
    d3)前記第1セットのシンボル特徴の全てが前記しきい値範囲内にある場合に、前記抽出されたシンボルにおけるランが、比較されている標本のテンプレートにおいて特定されるラン終点基準を満たすかどうかを決定する、
    ことを含み、
    前記プロセッサがさらに、
    e)前記比較dによりマッチするものが得られた場合に、前記抽出されたシンボルが比較されている標本の同値類中に存在することを示
    f)前記比較dによりマッチするものが得られない場合に、前記抽出されたシンボルを標本として用いて新たな同値類を作成
    g)該新たな同値類を前記記憶手段に記憶されている前記リストに追加
    同値類とは、問題を生じる程に画像の外観を変更することなく互いに置換されることのできるシンボルのセットであ
    第1の同値類の少なくとも1つのシンボルと第2の同値類の少なくとも1つのシンボルとが所定の条件でマッチする場合、第1の同値類と第2の同値類とを合併する、
    シンボルの分類装置
  2. バイナリ符号化された画像データ中に含まれるシンボルを分類する装置であって、
    プロセッサと、
    走査手段と、
    記憶手段と、
    を備え、
    前記プロセッサは、
    a) 前記走査手段によって走査され、前記記憶手段に記憶されたシンボルのランレングス符号化表現を抽出
    b) 前記抽出されたシンボルのシンボル特徴を前記ランレングス符号化表現から決定
    c) 前記抽出されたシンボルと比較することができる同値類のセットを前記記憶手段 に記憶されている同値類のリストから選択、該リストが以前に抽出されたシンボルから作成された同値類を含み、各同値類がテンプレートを含み、該テンプレートが前記同値類を表す標本にマッチングするための情報を含み、
    d)マッチするものが見出されるまで、又はマッチするものがない場合には全ての標本が比較されるまで、前記テンプレートを用いて前記セットの同値類の各々の標本と前記抽出されたシンボルを比較、該比較が、
    d1)第1セットのシンボル特徴が、比較されている標本のテンプレートにおいて特定される対応するしきい値範囲内にあるかどうかを決定
    d2)前記第1セットのシンボル特徴のいずれかが前記しきい値範囲内にない場合に、抽出されたシンボルが比較されている標本にマッチしないことを示
    d3)前記第1セットのシンボル特徴の全てが前記しきい値範囲内にある場合に、前記抽出されたシンボルにおけるランが、比較されている標本のテンプレートにおいて特定されるラン終点基準を満たすかどうかを決定する、
    ことを含み、
    前記プロセッサがさらに、
    e)前記比較dによりマッチするものが得られた場合に、前記抽出されたシンボルが比較されている標本の同値類中に存在することを示
    f)前記比較dによりマッチするものが得られない場合に、前記抽出されたシンボルを標本として用いて新たな同値類を作成
    g)該新たな同値類を前記記憶手段に記憶されている前記リストに追加
    同値類とは、問題を生じる程に画像の外観を変更することなく互いに置換されることのできるシンボルのセットであ
    第1の同値類の全てのシンボルと第2の同値類の全てのシンボルとが所定の条件で類似する場合、第1の同値類と第2の同値類とを合併する、
    シンボルの分類装置
JP31993596A 1995-12-20 1996-11-29 シンボル分類装置 Expired - Fee Related JP3977468B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US575305 1995-12-20
US08/575,305 US5778095A (en) 1995-12-20 1995-12-20 Classification of scanned symbols into equivalence classes

Publications (2)

Publication Number Publication Date
JPH09198511A JPH09198511A (ja) 1997-07-31
JP3977468B2 true JP3977468B2 (ja) 2007-09-19

Family

ID=24299772

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31993596A Expired - Fee Related JP3977468B2 (ja) 1995-12-20 1996-11-29 シンボル分類装置

Country Status (2)

Country Link
US (1) US5778095A (ja)
JP (1) JP3977468B2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6088478A (en) * 1998-02-13 2000-07-11 Xerox Corporation Method and apparatus for distinguishing bold face characters
US6748115B1 (en) 1998-06-19 2004-06-08 Cvision Technologies Llc Perceptually lossless image compression
US6920250B1 (en) * 1999-03-04 2005-07-19 Xerox Corporation Additive model for efficient representation of digital documents
US6449718B1 (en) 1999-04-09 2002-09-10 Xerox Corporation Methods and apparatus for partial encryption of tokenized documents
US6487311B1 (en) * 1999-05-04 2002-11-26 International Business Machines Corporation OCR-based image compression
US6519575B1 (en) * 2000-04-24 2003-02-11 General Electric Company System and method for classifying unknown data patterns in multi-variate feature space
JP4725001B2 (ja) * 2000-08-07 2011-07-13 ソニー株式会社 画像処理装置及び方法、並びに記録媒体
US7010166B2 (en) * 2000-11-22 2006-03-07 Lockheed Martin Corporation Character recognition system and method using spatial and structural feature extraction
US20080159640A1 (en) * 2003-11-06 2008-07-03 Chaoqiang Liu Document Image Encoding Decoding
US7403932B2 (en) * 2005-07-01 2008-07-22 The Boeing Company Text differentiation methods, systems, and computer program products for content analysis
US20070097755A1 (en) * 2005-10-27 2007-05-03 Marndi Raj N Method for comparing a first data set with a second data set
KR100664311B1 (ko) * 2005-11-18 2007-01-04 삼성전자주식회사 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법
US7783123B2 (en) * 2006-09-25 2010-08-24 Hewlett-Packard Development Company, L.P. Method and system for denoising a noisy signal generated by an impulse channel
GB2463920B (en) * 2008-09-30 2012-08-22 Cambridge Broadband Networks Ltd Improved data compression
US9053359B2 (en) 2012-06-07 2015-06-09 Konica Minolta Laboratory U.S.A., Inc. Method and system for document authentication using Krawtchouk decomposition of image patches for image comparison
US9230383B2 (en) * 2012-12-28 2016-01-05 Konica Minolta Laboratory U.S.A., Inc. Document image compression method and its application in document authentication
CN113127637A (zh) * 2019-12-31 2021-07-16 中兴通讯股份有限公司 一种字符的还原方法及装置、存储介质、电子装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4499596A (en) * 1982-06-28 1985-02-12 International Business Machines Corporation Adaptive facsimile compression using a dynamic extendable decision network
US4864628A (en) * 1983-08-26 1989-09-05 Texas Instruments Incorporated Method of optical character recognition
US4799270A (en) * 1986-03-20 1989-01-17 The Johns Hopkins University Image classifier
JPH01183793A (ja) * 1988-01-18 1989-07-21 Toshiba Corp 文字認識装置
US5075896A (en) * 1989-10-25 1991-12-24 Xerox Corporation Character and phoneme recognition based on probability clustering
JP3001966B2 (ja) * 1990-11-30 2000-01-24 株式会社リコー 文字認識用辞書の作成方法
US5263097A (en) * 1991-07-24 1993-11-16 Texas Instruments Incorporated Parameter normalized features for classification procedures, systems and methods
US5390259A (en) * 1991-11-19 1995-02-14 Xerox Corporation Methods and apparatus for selecting semantically significant images in a document image without decoding image content
US5303313A (en) * 1991-12-16 1994-04-12 Cartesian Products, Inc. Method and apparatus for compression of images
US5359671A (en) * 1992-03-31 1994-10-25 Eastman Kodak Company Character-recognition systems and methods with means to measure endpoint features in character bit-maps
US5479523A (en) * 1994-03-16 1995-12-26 Eastman Kodak Company Constructing classification weights matrices for pattern recognition systems using reduced element feature subsets

Also Published As

Publication number Publication date
JPH09198511A (ja) 1997-07-31
US5778095A (en) 1998-07-07

Similar Documents

Publication Publication Date Title
JP3925971B2 (ja) 統合同値類の作成方法
JP3977468B2 (ja) シンボル分類装置
US5303313A (en) Method and apparatus for compression of images
US5778092A (en) Method and apparatus for compressing color or gray scale documents
KR100938099B1 (ko) 클러스터링 시스템, 클러스터링 방법, 문서 인코딩 시스템 및 클러스터링 방법을 수행하기 위한 컴퓨터 판독가능 매체
CA2019134C (en) Method for compressing and decompressing forms by means of very large symbol matching
US7991224B2 (en) Segmenting digital image and producing compact representation
US6928435B2 (en) Compressed document matching
US6334001B2 (en) Iterative smoothing technique for pre-processing mixed raster content planes to improve the quality of a decompressed image and increase document compression ratios
JP4494563B2 (ja) トークン化によるイメージ分割を用いたイメージ処理方法および装置
US5835638A (en) Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JPH03201866A (ja) 圧縮形態のデータを含むデータから画像スキュー角度を決定する方法
US6360006B1 (en) Color block selection
US6088478A (en) Method and apparatus for distinguishing bold face characters
US6259814B1 (en) Image recognition through localized interpretation
US5751855A (en) Method and apparatus for detecting whether an electronic image has been faxed
Viswanathan et al. Characteristics of digitized images of technical articles
AU2005211628A1 (en) Processing digital image
AU2004242421A1 (en) Segmenting digital image and producing compact representation
AU2004242418A1 (en) Generating compressed output representation
JPH0573723A (ja) 文字分類方法及び文字認識装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060620

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060919

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060925

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070423

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070522

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070621

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100629

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110629

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110629

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120629

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees