JP3238504B2 - 書類分類方法 - Google Patents

書類分類方法

Info

Publication number
JP3238504B2
JP3238504B2 JP34117092A JP34117092A JP3238504B2 JP 3238504 B2 JP3238504 B2 JP 3238504B2 JP 34117092 A JP34117092 A JP 34117092A JP 34117092 A JP34117092 A JP 34117092A JP 3238504 B2 JP3238504 B2 JP 3238504B2
Authority
JP
Japan
Prior art keywords
alignment
passcode
white
document
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP34117092A
Other languages
English (en)
Other versions
JPH05346969A (ja
Inventor
スピッツ エイ.ロウレンス
ドネル ウィルコックス リン
Original Assignee
ゼロックス・コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ゼロックス・コーポレーション filed Critical ゼロックス・コーポレーション
Publication of JPH05346969A publication Critical patent/JPH05346969A/ja
Application granted granted Critical
Publication of JP3238504B2 publication Critical patent/JP3238504B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B41PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
    • B41JTYPEWRITERS; SELECTIVE PRINTING MECHANISMS, i.e. MECHANISMS PRINTING OTHERWISE THAN FROM A FORME; CORRECTION OF TYPOGRAPHICAL ERRORS
    • B41J21/00Column, tabular or like printing arrangements; Means for centralising short lines
    • B41J21/16Column, tabular or like printing arrangements; Means for centralising short lines controlled by the sensing of marks or formations on the paper being typed, an undersheet, or the platen
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、書類に記載された
「(マーク、記号、パターン等の)署名(シグネチャ
ー)」を利用して、例えば、異なる区分又は個々の書類
を識別するための、書類を分類する方法と装置に関す
る。
【0002】
【従来の技術】本発明と同じ出願者が別に申請した米国
特許出願番号第07/454、339号(1989年1
2月21日)に開示される方法では、テキストと図形の
内の少なくとも一方を載せたページの主要な位置合わせ
が検出される。この係属出願の内容は、ここに参照のた
め組み込まれる。その係属出願に記載の技術は、CCI
TTのG4画像内のパスコードの位置を基準にして位置
合わせ角度の「べき(パワー)」を計算するものであ
る。その技術では、白色画素を動かす出力値となるパス
コードの位置が基準マークとして利用されている。所定
角度での大きなべきにより、同方向でのパスコードの位
置合わせが特定される。
【0003】図1は、本発明方法と同様に係属出願の方
法が作用する環境のフォーマットを示すブロック図であ
る。図示されているのは、コンピュータシステム50の
一部分であって、画像を走査して画像を表すデジタルデ
ータを生成することが可能なスキャナー52を内蔵する
かまたはスキャナー52から出力信号を受信するよう接
続されている。デジタルデータはプロセッサー54へ伝
達される。プロセッサー54は、信号の入出力動作を制
御して、バス60を経由してプログラムメモリー56や
データメモリー58を呼び出す。
【0004】プログラムメモリー56は、特に、スキャ
ナー52による画像走査を制御するためのルーチン62
と、画像を表すデジタルデータを圧縮データフォーマッ
トに変換するためのルーチン64と、圧縮データから傾
斜(スキュー)角度を決定するためのルーチン66とを
有する。それゆえプログラムメモリー56は、データメ
モリー58を備えており、メモリー内の位置68では走
査制御ルーチン62で制御されてスキャナー52によっ
て生成されたデジタルデータ構造を記憶し、位置70で
は圧縮ルーチン64により生成された走査画像の圧縮表
示のデータ構造を記憶し、位置72では、例えば、傾斜
角度決定ルーチン66により生成された基準点位置など
の選択点データを含むデータ構造を記憶する。動作に必
要なプログラムメモリー56とデータメモリー58との
間の通信を簡単にするために、入出力動作ができるよう
両メモリーともバス60に接続されている。2つのメモ
リー56、58で1個のメモリーブロックを構成してい
るのは、勿論言うまでもない。
【0005】プロセッサー54に制御されて、傾斜角度
検出ルーチン66がデータメモリー58のさまざまな部
分をアクセスして傾斜角度を計算するのに必要なデータ
を得る。いったん計算されると、傾斜角度は出力部74
へ送られる。出力部74は、CRTディスプレイやコピ
ープリンターなどの検出結果を表示する手段を備える
か、あるいは、検出結果を使って傾斜を補償する画像デ
ータの修正のような次の動作を実行するための手段を備
えている。
【0006】ここで、画像データはグループ4標準に従
って圧縮されたものであるとするが、その圧縮方法は、
CCITT二次元グループ3フォーマットのような、他
の圧縮方法を用いて同様の結果が得られるよう変更され
てもよい。グループ4のコーディング方法は、対になっ
て連続する走査線上に見られる画素カラー遷移の間の存
在と相対間隔に従う。グループ4のコーディングにおい
ては、各走査線が次々と「コーディング線」となり、前
の走査線つまり「基準線」に基づいてコーディングされ
る。第1の走査線は、予め意図的に決められた全白基準
線に対応してコーディングされる。グループ4の圧縮標
準方法は、IEEEの公報68巻7号、854−867
頁、1980年7月発行、に記載のハンターらによる
「国際デジタルファクシミリコーディング基準(Interna
tional Digital Facsimile CodingStandards)」や国際
通信同盟のCCITT(国際電信電話諮問委員会)ブル
ーブック、ジェノバ1989年、(I 92−61−0
3611−2)に詳細に記述されている。
【0007】グループ4フォーマットの符号化には、垂
直、水平、パスの3つのモードがある。現在のモードを
決めるために、隣接走査線を比較して、例えば黒から白
への、基準線上の第1の画素カラー遷移として、コーデ
ィング線上に対応する(即ち、黒から白への)画素カラ
ー遷移が存在するかどうかを調べる。次に、基準線の遷
移からのコーディング線上の遷移の存在と相対間隔にし
たがってモードが決定される。
【0008】図2(a)の垂直モードでは、隣接走査線
上での黒から白または白から黒への遷移位置が水平方向
に近接している(3画素と等しいかまたはそれ以下)。
図2(b)の水平モードでは、両遷移位置は3画素分以
上離れている。さらに、図2(c)のパスモードにおい
ては、基準線上のどの遷移もコーディング線上の遷移点
に対応していない。圧縮データには、特に、モードコー
ドとコーディング線に対向する基準線上で測定された変
位を示す変位コードとが含まれている。
【0009】コーディングを図3と図4を参照してより
詳細に説明する。図3(a)と図3(b)では、基準点
76は異なるマークの印字(トポグラフィック)特徴を
基に配置している。印字特徴は常にマーク上に位置して
おり、特に、傾斜(スキュー)は、画像のグループ4圧
縮表示でのパスコードの位置から検出される。傾斜して
ない及び傾斜したテキストのパスコード基準点76の位
置は、それぞれ図3(a)と図3(b)のX印で示され
ている。
【0010】全てのパスコード(即ち、パスモードに対
応するコード)が個々のマークの1点に関連して定義さ
れているので、傾斜の度合に関わらず全基準点はマーク
のいずれかの点に位置することとなる。さらに、1つの
マークを示す圧縮データでは1個を越えるパスコードが
あるので、各マークにつき1個を越える基準点が存在す
る。例えば、典型的なフォント書体において、大文字小
文字の”A”、”H”、”K”などを含む多くの文字の
基本線に沿って2箇所にパスが生成され、”M”の大文
字や小文字では基本線に沿って3箇所にパスが生成され
る。
【0011】パスはエイリアスエラーの結果として生成
され、例えば、図3のように傾斜してない”G”の横線
の下側や、同じく傾斜してない”K”の右脚によくみら
れる。しかしそのようなエイリアスエラーを見分けるこ
とは、本説明では特に重視されるものではない。
【0012】2種類のパスがあって、即ち、1つは黒画
素から白画素への通路を示す白パスで、他の1つは白画
素から黒画素への通路を示す黒パスである。白パスは、
黒色構造体の底部を示すものなので、線端のような生ビ
ットマップ内での接続された要素の底部にもほぼ類似す
る。そのため、各接続された要素の底部では少なくとも
1個の白パスが必ず存在する。したがって、テキストや
文字を走査する場合に、基準点として白パスを使用する
のは非常に有利であるといえるが、傾斜角度を決定する
のに黒パスを代わりに使用してもよいことは明白であ
る。傾斜のないおよび傾斜したテキストの白パスコード
基準点78の位置が、図4(a)と図4(b)とに矢印
としてそれぞれ示されている。
【0013】グループ4のパスの符号化では、白パスと
黒パスが区別されていない。けれどもその区別は、カラ
ー状態を維持することにより決定される。カラー状態
は、白色に初期化される2進状態ビットによって維持で
きる。パスコード発生を含む後続の事象が状態ビットを
反転させることで、所望のパスカラーの実行トラックを
保持することができる。
【0014】図3(a)、図3(b)と図4(a)、図
4(b)とを比較してみると、図3より図4のテキスト
のほうが、より数少ない基準点が基本線をそれて生成さ
れているのが判る。つまり、位置合わせによって基本傾
斜測定値に基準点を与えるのに、白パスのほうが有利で
あることを示している。
【0015】図5は、書類の傾斜を決定するために利用
される傾斜検出ルーチン66のフロー図である。この図
では、画像が走査され、走査画像に対応してデジタルの
データが生成されて、そのデジタルデータがグループ4
圧縮データを生成するような選択されたデータ圧縮方法
に従って圧縮される。
【0016】まず最初に、圧縮画像データのデータ構造
内の白パスコードが検出される(ボックス92)。白パ
スコードが検出されると、その位置は適切な座標システ
ムに決定される(ボックス94)。データはxy座標値
として記憶される。それから、走査ページが最後まで達
したかどうかを決定するためテストされる(ボックス9
8)。達した場合は傾斜角度の決定を行い、そうでない
場合は同じページの次の白パスコードの探索を行う。
【0017】ボックス92乃至ボックス98のステップ
は、合わせて座標決定ルーチンと見なされ、図6により
詳細に開示されている。このフロー図では、まずボック
ス101はグループ4圧縮フォーマットにおけるデータ
の入力が示されている。xy座標ペアを用いて、xとy
が共に0に初期設定されて各新たなページの開始を示す
(ステップ102)。
【0018】グループ4コードが検出されて(ボックス
103)、水平コードと垂直コードを検出するためテス
トが行われる(ボックス104と112)。そこで、他
の全てのコードはパスコードとみなされる。異なるコー
ドの検出は、前述のように文字列認識によって実行され
る。検出コードが水平コードである場合は、x値は水平
コードに対応するx方向変位値だけ増加される(ボック
ス106)。つまり、グループ4の水平モードは、モー
ドを示すコードと、基準画素カラー遷移と現在の画素カ
ラー遷移との間の画素数を示す変位とをもっている。水
平コードの場合、その変位とは、特定の走査線上の画素
カラー遷移と同じ線上の次の画素カラー遷移との間の画
素数である。
【0019】Xの新たな値は、決定された位置合わせに
利用される横座標ではなく、走査線の第1画素位置から
の変位の実行値となる。係属出願の方法では、白パスコ
ードだけが位置合わせ決定に使用されている。
【0020】水平コードが検出されると仮定すると、2
進画素カラー状態ビットが増分される(ボックス12
2)。xの新しい値の計算が完了すると、例えば、xを
走査線の公知の長さと比較して、線の終端に届いたかを
判断するために検査が実行される(ボックス108)。
線の終端に届いていない場合は、コード検出がその走査
線のために継続して行われる(ボックス103)。線の
終端に届いた場合は、xは次の線の始めに対応するため
に0に設定され(ボックス110)、走査線数の実行カ
ウント数を保持するyが1だけ増分されて、ページ端に
届いたかどうかを決定するため調べられる(ボックス1
11)。ページ端は、y値をページの公知の線の数と比
較することによって検出される。ページ端に届いた場合
は、べきは多数の位置合わせ角度を介してスイープ(掃
引)されるさまざまな位置合わせ用に決定される(ボッ
クス126)。このべきは、後述詳しく説明される。ペ
ージ端に届かない場合は、コード検出が再開される(ボ
ックス103)。
【0021】検出コードが水平コードでない場合は、垂
直コードであるかどうかを決定するためテストされる
(ボックス112)。垂直コードである場合は、x値が
決定されて、水平コードのときと同様の方法でプログラ
ムが実行される。
【0022】コードが水平コードでも垂直コードでもな
い場合は、パスコードと仮定される。グループ4では白
パスと黒パスの区別をしないが、パスコードの種類はボ
ックス118での2進画素カラー状態ビットのトラック
を保持することにより区別される。まず最初に、状態ビ
ットは0に設定される(ボックス102)。白パスコー
ドに対応するため0が任意に選択される。1個のコード
が検出されるたびに、状態ビットがチェックされる。状
態ビットが0でない、つまりパスコードが白パスコード
でない場合は、xの新しい値がxの元の値と等しくなる
よう設定される(ボックス120)。次のコードがパス
コードでないとすると、次のコードはxの次の値を適切
に計算するために必要な次のコードに対応する必須情報
を有する。次のコードがパスコードならば、プロセスは
コードがパスコードでないコードと出会うまで繰り返さ
れる。このことは、グループ4のパスコードでは必要条
件である。続いて、xの新しい値が設定されてから(ボ
ックス120)、次のパスコードに備えて状態ビットが
増分される(ボックス122)。
【0023】状態ビットが0の場合は、白パスコードが
存在する。位置合わせのべきを計算するために、下記に
説明されている変換ステップのため白パスの位置が維持
される。この動作は、図1のデータメモリー58での選
択点データ位置72で実行可能である。白パスコードの
位置の維持は、ボックス124で実行される。次に、上
記のように、xの値が設定され、状態ビットが増分され
て、プログラムが走査線やページ端をテストする。
【0024】図5に戻って、走査線やページの端部が発
見されたと仮定されると、プログラム部分126は複数
の位置合わせのべきを決定する。最初に、位置合わせ角
度が0に設定される(ボックス128)。この位置合わ
せは、画像が始めに走査された時点での位置合わせに相
当する。例えば、複数の異なる高さのそれぞれで(例え
ば、6ポイント文字の高さの1/3に相当する各点で)
検出されたパスの数を加算することにより、位置合わせ
のべきを計算する。なお、位置合わせ方向に垂直な線に
沿って延びる高さがテストされる。べきの計算は、回転
的に位置合わせされた高さの各々の増分に見られるよう
なパスのカウント数(平方の和)の1より大きい正のべ
き(例えば、2)の和を基準にして位置合わせを計算を
すれば、より効率的である。分布の分散値は、カウント
数の平方の和を最大にすることにより最大とされ、その
結果が、傾斜角度が決定される位置合わせの「べき」の
インデックスとなる。そのようなべき計算の方法が、た
とえば、SPSEハイブリッド画像システムのシンポジ
ウム会報、1987年、21−24頁、ヘンリー・S・
ベアード(Henry S. Baird)の報告「印刷書類の傾斜角
度」に記述されており、その内容は参照のためここに組
み込まれている。
【0025】係属出願に従って、べき決定の方法では、
データメモリー58のメモリー位置72と各走査線ごと
に決定されるデータメモリーに記憶されたx値の数を呼
び出す。各線毎のx値の数の平方は、現在の位置合わせ
角度での位置合わせのべきを表すアレイに累積される
(ボックス130)。平方数のアレイは現在の位置合わ
せ角度と共に記憶されて(ボックス132)、データメ
モリー58の一部分となる。
【0026】位置合わせ角度は、選択された量、例え
ば、1度だけ増分される(ボックス134)。位置合わ
せのべきは、位置合わせ角度の範囲を有する位置合わせ
に合わせて決定される。位置合わせ角度の範囲の選択
は、予期される位置合わせ角度の範囲、予期される位置
合わせ強度、予期される位置合わせ数などの幾つかの要
素に基づいて行われる。位置合わせ角度の範囲が大きけ
れば、所定の角度増分のための計算時間も多くなる。例
えば、テストされる傾斜角度が+40度から−40度の
範囲とする。いったん増分されると、現在の位置合わせ
角度が選択された範囲内にあるかどうかを決定するため
テストされる(ボックス136)。現在の位置合わせ角
度が選択された角度範囲内である場合は、白パスコード
の位置が変換される(ボックス138)。いくつかのパ
スコード位置変換方法があるが、それらの適用性は、使
用される座標システム、使用可能なメモリー容量、必要
な計算の速度などに依存する。
【0027】現在の位置合わせ角度が選択された角度外
にある場合は、その前に記憶されている複数の位置合わ
せ例のべきを比較して最大べきが決定される(ボックス
140)。次に最大べきは、例えば、絶対角度、角度の
スペクトル、またはそれらのべきなどの形式で、多様な
フォーマットに出力される(ボックス142)。出力の
フォーマットは、その結果の使用目的に依存する。
【0028】米国特許5、001、769号には、基準
線に関して画像を示す画素のファイルを生成し、それら
画素をファイルを横切って選択された角度の想像線の連
続セグメントに投影し、セグメントの画素の数を数え
て、セグメントカウントに適用されるエンハンスメント
関数の最大値を生成する投影を見つけることによって、
画像の主要な配向と基準線との間の回転誤差(傾斜)を
分布し訂正する方法や装置が開示されている。
【0029】
【発明が解決しようとする課題】本発明の目的は、圧縮
領域または非圧縮領域のいずれかで検出可能な特殊ロゴ
タイプを利用して書類区分を識別する方法と装置、及び
その方法を実行する手段を提供することである。ロゴタ
イプは、そのようなロゴタイプをもたない書類の署名と
は著しく異なる「位置合わせ署名」の基となる角度位置
合わせを含んでいることを特徴としている。
【0030】
【課題を解決するための手段と作用】決定された角度位
置合わせの3個以上の位置合わせ構造から成るロゴタイ
プを有する書類を分類するための方法であって、前記書
類の情報に対応するデータ信号を生成するため前記書類
を走査するステップと、前記データ信号を圧縮するステ
ップと、前記データ信号のパスコードとそれらの位置を
検出するステップと、複数の位置合わせ角度各々におけ
る前記パスコードの数のべきを決定するステップと、前
記決定されたべきを予め決定された公知のロゴタイプ
べきの分布と比較することによって書類を分類する
テップと、を有する
【0031】好ましくは、ロゴタイプは空間的に順序付
けられた位置合わせ構造のセットで構成されており、各
構造は、CCITTのグループ4の符号化で公知で反復
可能なパターンのパスコードを生成する。理論的には最
低3セットの位置合わせ構造が必要であるが、実際には
3セットを越えるセット、例えば、主に画像ノイズ、回
転(傾斜)、ユーザーメッセージからのロゴタイプ検出
能力などによると、20以上とされるのが望ましい。通
常予期されるノイズレベルである場合は、80個の山形
記号の位置合わせ構造が許容範囲であるといえる。パス
コードの位置の「色」と分布の分析は、個々のロゴタイ
プの位置合わせ署名特性を基にする。入力書類の署名
は、所望の区分の書類の公知の統計値と比較される。
【0032】ロゴタイプは、必ずしも必要ではないが、
書類の頂部に記載されるのが望ましい。ロゴタイプ検出
技術でも、圧縮画像から生成された位置合わせ角度のべ
きを利用するのが望ましい。画像の署名は、位置合わせ
角度の範囲でべきを計算することによって生成される。
署名が公知のロゴタイプの署名と整合するならば、ロゴ
タイプが検出される。
【0033】
【実施例】本発明によって、ロゴ、即ち、ロゴタイプが
印刷または書類上に記載される。ロゴタイプには、デー
タ走査技術によって書類が識別されることを可能にする
埋め込まれたデータ、即ち、「署名」を含み、以下の段
落で詳しく説明されている。この技術は書類の分類を可
能にする。書類の圧縮解除の有無に関わらず実行され
る。「署名」は係属中の出願の上述の技術と類似する技
術によって、「署名」の決定を可能にする決定可能な位
置合わせ特性を有する。
【0034】書類上に記載されたロゴタイプは、本発明
では、1個以上の位置合わせマーク又は構造で構成され
ている。位置合わせマークは、予測可能な、耐ノイズ
の、抗傾斜パス位置特性をもついかなる形状でもよい。
一般に、このことは水平表面の回避を意味する。
【0035】例えば、ロゴタイプは図7(a)と図7
(b)に図示されるような1個以上の山形形状の構造を
用いて構成されている。図7(a)に示されるような下
向き山形記号は、構造の頂部付近では黒パスを1個発生
させ、底部では白パスを1個発生させる利点をもつ。な
お、位置合わせ角度は、垂直変位に対して独立してい
る。
【0036】位置合わせマーク記号の基本位置合わせ
は、主位置合わせに関連する位置合わせ分布を基礎にし
た署名確認の計算を可能にするため、ページ上の(原文
の)資料と一致するのが好ましい。
【0037】ロゴタイプを構成している位置合わせ構造
は、予測可能なパスコード生成特性をもっている。パス
コード生成特性は、傾斜に因する小さな角度回転に関わ
らず堅固で、かつ、相対的にノイズ抵抗性をもつ。本発
明によれば、パスコードは白と黒の両画素の実行のため
に生成されるので、パスコードの両モードを生成する位
置合わせ構造を利用するのが望ましい。
【0038】しかしながら、図7(b)に示されるよう
な上向き山形記号は底部で白パスを2個生成するが、黒
パスを生成しない。従って、図7(b)に示されるよう
な構造は、本発明の方法や装置では好ましくない。
【0039】パスコードを生成する構造を形成するため
に(縦法線に)45度の角度にすれば、そのような位置
合わせ構造は書類の小角度傾斜のために疑似パスコード
を生成することはない。
【0040】本発明のロゴタイプは、従来の制御された
位置合わせ構造の幾何配列で構成されている。ロゴタイ
プは、(ノンロゴタイプに関して)堅固な位置合わせの
生成と共に疑似パスコードの抑制に関してできる限り堅
固でなければならない。位置合わせ構造の長さ(高さ)
を制御することにより、白と黒のパス位置合わせ間の固
定角度関係が維持できる。
【0041】図8に適切なロゴの1例が示されている。
このロゴは、その位置合わせ構造で4つのピークを生成
している。図9に示されているように、白パスは0度と
20度で位置合わせし、黒パスは12度と32度で位置
合わせしている。
【0042】位置合わせの「べき」を見つける技術は係
属出願の方法と基本的に同じだが、本発明では、べき分
布が白パスと黒パスとで別々に決定され、これら分布が
1個の署名につながっている点が異なる。白パス位置に
ついては、図5のフロー図を参照して前に説明されてい
る。図10のような同様のプロセスで、黒パスは配置さ
れる。図10のプロセスが図5のプロセスと違う点は、
ボックス92’で黒パスコードが識別されて、ボックス
94’で黒パスコードの座標のx値とy値が決定される
ことだけである。例えば、黒パスコードの決定のさい、
状態ビットは1に初期設定されるため、0値が黒パスコ
ードに対応する。
【0043】前記のような係属出願では、上述のよう
に、書類の傾斜角度を特定するために、最適な位置合わ
せのみが使用されている。しかしながら、本発明では、
位置合わせ分布、即ち、署名が書類を分類するために利
用されている。
【0044】多数の位置合わせ構造の精密な設定、配
向、形状から生ずる位置合わせの基本概念のほうが、位
置合わせ構造が少数またはゼロの書類から生ずる基本概
念に比べて、統計的に著しく優勢であるため、ロゴタイ
プを多数の位置合わせ構造から構成することが望まし
い。より多数の位置合わせ構造は、統計的にノイズ存在
の検出能力を増加させる、即ち、より高い信号対ノイズ
比を供与することができる。追加の堅固性は、もしあれ
ば、ロゴの位置として知られているページの単一の領域
を分析から得られるので、可能ならば、書類の特定の場
所にてロゴタイプを位置し、分類のため書類のこの部分
だけを走査すればいっそう望ましい。
【0045】本発明の方法と装置は、例えば、ファクシ
ミリサービス、即ち、毎秒1インチ(約2.54cm)
の用紙供給速度の、リアルタイムで実施されるのが有利
である。
【0046】ロゴタイプの署名は、べき対角度データか
ら構成されている。データはパスの数に正規化される。
ここに表示される測定結果では、位置合わせ分布のピー
ク値が+/−10度の範囲にあるため、アーチファクト
の印刷、コピー、走査による累積回転がその範囲内であ
る場合での実施は制限される。ピーク値が見つかった
ら、位置合わせ署名データが45度の範囲にて計算され
る。この角度範囲の制限のため、データ内に不要な位置
合わせを見つける可能性が減少する。図8のロゴタイプ
の例での位置合わせ署名は、図9に示されるようなピー
ク値を示している。
【0047】本実施例で説明された原型のロゴタイプ
は、0度、12度、20度、32度と4つの位置合わせ
をもつ。0度と20度の位置合わせは位置合わせ構造の
底部で生成された白パスにあり、12度と32度の位置
合わせは位置合わせ構造の頂部近くで生成された黒パス
にある。必要に応じて、パス位置の空間的コヒーレンス
を追加の署名要素として利用できる。
【0048】図11(a)は、本発明のロゴタイプをも
つファクシミリ送付用紙(FacsimileCover Sheet)の1例
であり、図12(a)は、ロゴタイプがない点が図11
(a)の例と違うファクシミリ送付用紙である。それら
書類の白パスと黒パスの署名は、図11(b)と図12
(b)にそれぞれ図示されている。図11(a)の書類
では特有の「署名」が顕著であるが、図12(a)の書
類の分析からはそのような「署名」がみられない。
【0049】ロゴ検出は、位置合わせ角度の範囲での白
のパスコードと黒のパスコードのべきから計算された署
名データの統計に基づいている。1つの実際例では白パ
スと黒パスに46個の角度が使用されており、92成分
からなる署名が提示される。ロゴタイプ検出の目的は、
署名原型と書類との間の距離が設定しきい値より小さい
場合、ロゴが存在すると判断される。しきい値距離値
は、誤ったロゴ検出に関するロゴの見つからない(ミッ
シング)重要性によって経験的に設定される。
【0050】所望の署名とシステム内で予期される種類
のノイズのサンプルをもつトレーニング(練習)書類を
有する必要がある。そのようなノイズは、書類のコピー
角度や傾斜角度に原因する。トレーニングデータの平均
値を計算して、署名原型として使用する。また、位置合
わせ角度間の相関情報を示すトレーニング書類の共分散
マトリックスも算出する。署名原型と書類との距離は、
固定共分散マトリックス条件からのユークリッド距離
か、または、共分散マトリックスを基にする距離を重み
付けるマハラノビス距離となる。
【0051】実験的に設定されたしきい値の使用するオ
プションとして、ロゴを含まない書類の統計値を計算す
る方法がある。その分類処理は、ロゴをもつトレーニン
グデータの平均値ベクトルのユークリッド距離またはマ
ハラノビス距離が、ロゴのないトレーニングデータの平
均値ベクトルの距離より小さい場合に、ロゴが存在する
と宣言する。また、ロゴと非ロゴデータのガウス分布を
使って、ロゴの有無の事前確率を設定し、誤った検出や
見つからない検出のペナルティ重みを設定して、リスク
が最小の分類を行うことも可能である。
【図面の簡単な説明】
【図1】係属出願の方法と同様に、本発明で使用される
コンピュータシステムのブロック図である。
【図2】(a)、(b)及び(c)は、CCITTグル
ープ4圧縮標準の符号化モードを示す。
【図3】(a)乃至(b)は、それぞれ非傾斜テキスト
と傾斜テキストでのCCITTグループ4圧縮標準のパ
スコードを基にした基準点の位置を示す。
【図4】(a)乃至(b)は、CCITTグループ4圧
縮標準の白パスコードを基にした基準点の位置を示す。
【図5】本発明の方法にて使用可能な公知のフロー図を
示す。
【図6】本発明の方法にて使用可能な別の公知のフロー
図を示す。
【図7】(a)乃至(b)は、本発明の位置合わせ構造
で使用可能な山形記号を示す。
【図8】本発明に従った適切なロゴタイプの図である。
【図9】図8のロゴタイプの白パスと黒パスの署名を示
す。
【図10】黒パスを検出するため、図5のフローに対応
するフロー図である。
【図11】(a)乃至(b)は、本発明に従ったロゴタ
イプを載せるファクシミリ用紙とその署名を示す。
【図12】(a)乃至(b)は、図11(a)と類似す
るが、ロゴタイプを載せないファクシミリ用紙とその署
名を示す。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平3−201866(JP,A) 特開 昭52−136629(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/20 340 G06T 1/00 310 JICSTファイル(JOIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 決定された角度位置合わせの3個以上の
    位置合わせ構造から成るロゴタイプを有する書類を分類
    するための方法であって、 前記書類の情報に対応するデータ信号を生成するため前
    記書類を走査するステップと、前記データ信号を圧縮するステップと、 前記データ信号のパスコードとそれらの位置を検出する
    ステップと、 複数の位置合わせ角度各々における前記パスコードの数
    のべきを決定するステップと、 前記決定されたべきを予め決定された公知のロゴタイ
    プのべきの分布と比較することによって書類を分類する
    ステップと、 を有する書類を分類するための方法。
JP34117092A 1991-12-05 1992-11-27 書類分類方法 Expired - Fee Related JP3238504B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US80325391A 1991-12-05 1991-12-05
US803253 1991-12-05

Publications (2)

Publication Number Publication Date
JPH05346969A JPH05346969A (ja) 1993-12-27
JP3238504B2 true JP3238504B2 (ja) 2001-12-17

Family

ID=25186026

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34117092A Expired - Fee Related JP3238504B2 (ja) 1991-12-05 1992-11-27 書類分類方法

Country Status (2)

Country Link
US (1) US5414781A (ja)
JP (1) JP3238504B2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6985600B2 (en) 1994-03-17 2006-01-10 Digimarc Corporation Printing media and methods employing digital watermarking
US5642431A (en) * 1995-06-07 1997-06-24 Massachusetts Institute Of Technology Network-based system and method for detection of faces and the like
US6104834A (en) 1996-08-01 2000-08-15 Ricoh Company Limited Matching CCITT compressed document images
US6389436B1 (en) * 1997-12-15 2002-05-14 International Business Machines Corporation Enhanced hypertext categorization using hyperlinks
US6044375A (en) * 1998-04-30 2000-03-28 Hewlett-Packard Company Automatic extraction of metadata using a neural network
US6327388B1 (en) * 1998-08-14 2001-12-04 Matsushita Electric Industrial Co., Ltd. Identification of logos from document images
EP0989738A1 (en) * 1998-09-22 2000-03-29 Hewlett-Packard Company Document analysis method to detect BW/color areas and corresponding scanning device
US7039856B2 (en) * 1998-09-30 2006-05-02 Ricoh Co., Ltd. Automatic document classification using text and images
WO2002007067A1 (en) * 2000-07-19 2002-01-24 Digimarc Corporation Print media with embedded messages for controlling printing
US7511722B1 (en) * 2004-08-27 2009-03-31 Apple Inc. Method and system for fast 90 degree rotation of arrays
US7738680B1 (en) 2004-11-24 2010-06-15 Adobe Systems Incorporated Detecting an object within an image by incrementally evaluating subwindows of the image in parallel
US7440587B1 (en) 2004-11-24 2008-10-21 Adobe Systems Incorporated Method and apparatus for calibrating sampling operations for an object detection process
US7587101B1 (en) 2005-02-28 2009-09-08 Adobe Systems Incorporated Facilitating computer-assisted tagging of object instances in digital images
US8176004B2 (en) * 2005-10-24 2012-05-08 Capsilon Corporation Systems and methods for intelligent paperless document management
US7747495B2 (en) * 2005-10-24 2010-06-29 Capsilon Corporation Business method using the automated processing of paper and unstructured electronic documents
US8503797B2 (en) * 2007-09-05 2013-08-06 The Neat Company, Inc. Automatic document classification using lexical and physical features
US10474858B2 (en) 2011-08-30 2019-11-12 Digimarc Corporation Methods of identifying barcoded items by evaluating multiple identification hypotheses, based on data from sensors including inventory sensors and ceiling-mounted cameras

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4021777A (en) * 1975-03-06 1977-05-03 Cognitronics Corporation Character reading techniques
DE3101543A1 (de) * 1981-01-20 1982-08-26 Licentia Patent-Verwaltungs-Gmbh, 6000 Frankfurt "buerokommunikationssystem"
US4400737A (en) * 1981-07-08 1983-08-23 Fuji Xerox Co., Ltd. Apparatus for producing and reproducing embedded pattern
US4499499A (en) * 1982-12-29 1985-02-12 International Business Machines Corporation Method for identification and compression of facsimile symbols in text processing systems
US4555802A (en) * 1983-01-10 1985-11-26 International Business Machines Corporation Compaction and decompaction of non-coded information bearing signals
US4941189A (en) * 1987-02-25 1990-07-10 Lundy Electronics & Systems, Inc. Optical character reader with skew recognition
US4965744A (en) * 1987-03-13 1990-10-23 Ricoh Company, Ltd. Apparatus for erasing and extracting image data from particular region of orignal document
JPS647274A (en) * 1987-06-30 1989-01-11 Toshiba Corp Character reader
US5001766A (en) * 1988-05-16 1991-03-19 At&T Bell Laboratories Apparatus and method for skew control of document images
US5001769A (en) * 1988-12-20 1991-03-19 Educational Testing Service Image processing system
US5010580A (en) * 1989-08-25 1991-04-23 Hewlett-Packard Company Method and apparatus for extracting information from forms
US5245676A (en) * 1989-12-21 1993-09-14 Xerox Corporation Determination of image skew angle from data including data in compressed form
JPH03218589A (ja) * 1990-01-24 1991-09-26 Syst Yamato:Kk ファクシミリを利用したコンピュータ入力システム
US5247591A (en) * 1990-10-10 1993-09-21 Interfax, Inc. Method and apparatus for the primary and secondary routing of fax mesages using hand printed characters

Also Published As

Publication number Publication date
JPH05346969A (ja) 1993-12-27
US5414781A (en) 1995-05-09

Similar Documents

Publication Publication Date Title
JP3238504B2 (ja) 書類分類方法
EP0434415B1 (en) Method of measuring skew angles
US7268906B2 (en) Systems and methods for authenticating and verifying documents
US6176427B1 (en) Variable formatting of digital data into a pattern
US8281999B2 (en) Variable formatting of digital data into a pattern
US7130445B2 (en) Systems and methods for authenticating and verifying documents
US7729018B2 (en) Image processing system, image forming apparatus, image processing method and program recording medium
JP4343968B2 (ja) 画像形成装置及び方法
JPH04229763A (ja) 画像処理装置および方法
JPH0567201A (ja) 署名を自動検証する方法と装置
JP4419269B2 (ja) 二次元コード抽出方法
US5835638A (en) Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols
JP4424845B2 (ja) イメージデータ圧縮方法及び復元方法
US7400768B1 (en) Enhanced optical recognition of digitized images through selective bit insertion
JP3534128B2 (ja) 書類の上下方向検知方法及び装置
US6771842B1 (en) Document image skew detection method
US7151859B2 (en) Method and system for correcting direction or orientation of document image
US7007303B2 (en) Systems and methods for authenticating documents
JP3209746B2 (ja) 文字認識システムで用いる文字位置確認装置および方法
JP4812893B2 (ja) イメージデータ圧縮方法及び復元方法
Spitz Analysis of compressed document images for dominant skew, multiple skew, and logotype detection
JPS60116078A (ja) 文字認識装置
JP4517667B2 (ja) 文書画像照合装置、文書画像位置合わせ方法及びプログラム
JP3456279B2 (ja) 画像処理制御用原稿と画像処理装置
JP2875330B2 (ja) 文字認識方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010918

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees