JPH0728940A - 文書処理のためのイメージ・セグメント化およびイメージ要素分類の方法 - Google Patents

文書処理のためのイメージ・セグメント化およびイメージ要素分類の方法

Info

Publication number
JPH0728940A
JPH0728940A JP6104202A JP10420294A JPH0728940A JP H0728940 A JPH0728940 A JP H0728940A JP 6104202 A JP6104202 A JP 6104202A JP 10420294 A JP10420294 A JP 10420294A JP H0728940 A JPH0728940 A JP H0728940A
Authority
JP
Japan
Prior art keywords
image
image element
image elements
feature
elements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6104202A
Other languages
English (en)
Other versions
JP2802036B2 (ja
Inventor
Klaus Rindtorff
クラウス・リンドトルフ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH0728940A publication Critical patent/JPH0728940A/ja
Application granted granted Critical
Publication of JP2802036B2 publication Critical patent/JP2802036B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/30Writer recognition; Reading and verifying signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Character Discrimination (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】 【目的】 手書き情報の文字認識を行う前、特に署名を
分析し認識する前に、文書から書式要素、線、印刷され
た文字などの不要な情報を除去すること。 【構成】 イメージをセグメント化し、分類し、クリー
ニングする方法を提供する。この方法は、異なるクラス
の要素を含むイメージ・データを入力として有する適用
業務に使用することができる。以後の処理には有効な要
素だけを維持すればよいので、処理するデータの量を大
幅に削減することができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書処理のためのイメ
ージ・セグメント化およびイメージ要素分類の方法に関
し、特に、手書き情報の文字認識を行う前、特に署名を
分析し認識する前に、文書から書式要素、線、印刷され
た文字などの不要な情報を除去する方法に関する。
【0002】
【従来の技術】イメージを処理する場合、通常、カメラ
またはスキャナを使用してピクチャを捕捉する。その結
果得られるイメージは、それぞれ特定の位置でのイメー
ジの強度を表す個々のピクセルの二次元アレイとして記
憶される。
【0003】大抵の場合、結果として得られるイメージ
には不要な情報が含まれている。ごみや不要な背景情報
は、捕捉プロセスを操作することによって削減すること
ができる。不要な情報が有効な情報とは異なる周波数帯
域に属する場合は、捕捉中に単に濾過するだけでよい。
【0004】捕捉プロセス後のイメージ品質は、まだ十
分良好なものとは言えない。メジアン・フィルタ、高域
および低域フィルタ、ラプラス演算子など、イメージ情
報を濾過する複数の方法が存在する。これらの解決法
は、イメージ品質を大幅に向上することができるが、き
わめて時間がかかる。
【0005】パターン認識適用業務の場合、イメージ品
質は、背景と前景のコントラストを良くするための要件
によって規定される。たとえば、典型的な文字認識適用
業務に使用される白黒イメージは、白い背景と前景の黒
い文字から構成される。線、図面、スタンプ、および認
識プロセスに入力されない捕捉されたイメージのその他
の部分は除去しなければならない。これを、前述のよう
なフィルタ操作によって行うことはできない。
【0006】署名確認や手書き認識などのその他のパタ
ーン認識プロセスには、はっきりした入力も必要であ
る。これらのプロセスは通常、イメージからの特徴値の
抽出に基づいており、したがって、不要なイメージ情報
によって認識プロセスが阻害される。有効特徴の抽出お
よび比較に基づく技術の一例は、自動署名確認に関する
IBMの公開欧州特許出願EP-A-0 483 339号に記載され
ている。
【0007】前述のイメージまたはパターン認識の適用
業務にはもう1つの問題領域がある。典型的なイメージ
内容および要素の位置が捕捉の前に分かっている場合、
その位置に関する情報を使用して所望の情報を分離する
ことができる。複数のクラスのイメージ内容が存在する
場合、最初に、正しいクラスを認識しなければならな
い。たとえば、文書処理の場合、位置が定義されている
ならば、文字情報をイメージから抽出することができ
る。そのために、文書の種類を最初に知っておくか、あ
るいは適切な技術を使用して認識しておかねばならな
い。
【0008】
【発明が解決しようとする課題】本発明の目的は、前述
の周知のプロセスの欠点を解消することであり、特に、
イメージ要素において文書のイメージを柔軟かつ安全に
分離することができ、認識プロセスの前に、走査される
文書内の不要なイメージを除去しておけるようにイメー
ジ要素を見つけて分類することができる方法を提供する
ことである。
【0009】
【課題を解決するための手段】本発明によれば、上記そ
の他の目的は、独立請求項1で定義されるステップを適
用することによって基本的に解決することができる。請
求項1に記載された基本的な解決法の、その他の利点を
もつ実施例は、従属請求項で定義されている。これらの
利点は、特に説明を要しないものもあるが、そうでない
ものは以下の具体的説明で定義し説明する。
【0010】本発明の方法は、イメージ要素を見つけて
分類することができる。これは基本的に4つのステップ
で行われる。第1のステップでは、イメージ要素をセグ
メント化する。このステップでは、イメージ要素を探索
し、さらに処理するために記憶する。第2のステップで
は、イメージ要素から特徴情報を抽出する。第3のステ
ップでは、第2のステップで得られた特徴情報に基づ
き、第1のステップで得られた各イメージ要素を分類す
る。第4のステップでは、不要な情報として分類された
要素を除去する。
【0011】
【実施例】以下では、基本的に4つのステップを含む本
発明の方法を、図1ないし5に関して詳細に説明する。
【0012】<セグメント化>第1のステップでは、ピ
クセル・アレイを水平および垂直方向に走査する。アレ
イ中の各ピクセルを検査し、単一のイメージ要素に属す
る近隣ピクセル群を探索する。
【0013】イメージ要素は、同じあるいはほぼ同じ強
度を有し、共通の境界をもつ複数のピクセルから構成さ
れる。境界は、水平、垂直、または斜めの近隣ピクセル
によって与えられる。強度値の合致が必要かどうかは、
静的しきい値、または各ピクセルの近隣ピクセルでの強
度情報から算出した動的しきい値に依存することができ
る。図1には、このプロセス中に見つかったイメージか
ら得られる典型的なイメージ要素を示す。図1に示すイ
メージは、小文字"e"の強度マトリックスである。この
小文字"e"は、符号10で示してある。ピクセル強度値
は、矢印11の方向の複数の列と、矢印12で示される
複数の行によって与えられる。強度値は、番号0、1、
2、3、4、5で示してある。依然として文字"e"10
に属する強度のしきい値として、領域14に示す値2を
選択する。2を上回るすべての値は、線13によって囲
まれ、文字"e"10の外周を示している。
【0014】この段階でに見つかった要素は、依然とし
て、分離する必要がある複数の論理部分を構成する可能
性がある。これらの部分の接続部を見つけて、除去しな
ければならない。線の場合、好ましい方向、すなわち線
に沿った方向を使用することができる。この方向が急激
に変化する場合、近隣ピクセル間の接続部が除去される
ので、線は複数のイメージ要素に分解される。
【0015】イメージの各線を見つけて追従する方法の
他に、接続されたピクセルの数も使用することができ
る。そのためには、イメージを平行ランで走査し、その
ような2つのランの間の境界を計算する。この長さを、
そのイメージにおける前のランおよび次のランの長さと
比較する。この長さが特定のしきい値を下回る場合、ピ
クセル間の接続部は切断される。図2に、ピクセル・ラ
ンへの分解の一例を示す。図2に示すイメージ要素は、
矢印20の方向に沿ってランに分解されている。ラン2
1、ラン22、ラン23、およびラン24が示されてい
る。ラン22とラン23の間の接続部は破線で示し、矢
印29で指してある。この場合、ラン22とラン23の
間の接続は、ラン21とラン22の間の長さおよびラン
23とラン24の間の長さに比べて短すぎる。さらに、
他のラン25、26、27でも、同様な接続部を破線で
示し、矢印28で指してある。したがって、ラン25と
ラン26の間の接続部は、前のランおよび後のランと比
較して短すぎると計算される。したがって、図の領域2
8および29で、ピクセル接続部が切断される。要約す
ると、ピクセル接続部が単一のイメージ要素を構成する
のに十分でない位置が、矢印28および29で示されて
いる。
【0016】単一のイメージ要素を構成するピクセル群
を見つけるために、前述の両方の条件を組み合わせて使
用する。必要な最小サイズを使用すると、有効な情報を
含むのに十分な大きさのイメージ要素だけを選択し、他
のイメージ要素をただちに廃棄することができる。これ
によって、イメージ中の背景雑音が除去され、イメージ
要素の数が少なく維持される。このプロセス中に見つか
った各イメージ要素の位置は、さらに処理するために記
憶される。
【0017】<特徴抽出>各イメージ要素ごとに、1組
の特徴値を算出する。大部分の特徴値は、セグメント化
プロセス中にただちに算出される。これは特に有益であ
り、また場合によっては、2つの異なるイメージ要素
が、交差する周囲領域をもつので重要である。特徴計算
中にこれらの領域を使用する場合、一方のイメージ要素
の各部分が他方のイメージ要素の特徴値に影響を及ぼす
可能性がある。説明を簡単にするために、周囲イメージ
要素領域として矩形を使用する。図3に、3つのイメー
ジ要素34、35、36の矩形の周囲領域31、32、
33の例を示す。イメージ要素34および35は、周囲
領域31および32の交差部を有する。周囲領域33を
有するイメージ要素36は、イメージ要素34の周囲領
域31の完全に内側に位置している。
【0018】ローカル特徴と近隣特徴という2つの特徴
クラスがある。ローカル特徴は、イメージ要素自体の特
性を記述する。近隣特徴は、イメージ要素と、その近隣
イメージ要素の関係を記述する。
【0019】<ローカル特徴>ローカル特徴の1つは密
度特徴である。特徴は、イメージ要素の最大水平および
垂直エクステンションによって表される矩形領域中の前
景ピクセルの数と背景ピクセルの数の比として算出され
る。この比率は、垂直または水平直線の場合、かなり高
くなる。もう1つのローカル特徴は複雑度特徴である。
この特徴は、垂直および水平方向で計算され、特定の方
向についての高強度と低強度の間の変化の平均数によっ
て与えられる。この特徴は、イメージ要素に属する線分
の数を表す。もう1つのローカル特徴としてイメージ要
素の包絡線の幅と高さの商から縦横比特徴を算出するこ
とが可能である。ここで説明した以外のローカル特徴も
存在し得る。
【0020】<近隣特徴>特定の方向での近隣イメージ
要素の数も、特徴値として使用することができる。この
特徴値を、ほぼ同じサイズ特性をもつイメージだけをカ
ウントする条件と組み合わせると、印刷されたテキスト
用の良好な標識が得られる。他の近隣特徴も存在し得
る。
【0021】図4に、典型的なテキスト行に見られるイ
メージ要素の一例を示す。この例は、それぞれ単一のワ
ードを囲む2つの大きな矩形領域41および42を示し
ている。各文字はそれ自体の周囲領域を有する。したが
って、ワード"the"41には"t"を表す内部領域41
1、"h"を表す内部領域412、および"e"を表す内部
領域413がある。同様に、領域42中のワード"quic
k"は、それぞれ文字"q"、"u"、"i"、"c"、"k"を表
す矩形形状の5つの内部領域421、422、423、
424、425を有する。
【0022】最後に、各ローカル特徴は、近隣特徴の等
価物をもつことができる。そのために、固定半径によっ
て与えられる領域の内部にある各イメージ要素からロー
カル特徴値の平均を算出することができる。これらの特
徴値は、それぞれの距離で加重される。
【0023】<分類>イメージ要素の分類は、算出され
た特徴セットに基づいて行われる。そのために、人工ニ
ューラル・ネット手法を使用することができる。1つの
クラスに属するイメージ要素だけを見つけねばならない
場合、単一の出力ノードをもつ単純フィードフォワード
・ネットで十分である。各イメージ要素の特徴値がニュ
ーラル・ネットに送られる。特徴値は、ニューラル・ネ
ット内部で加重され、その特徴セットのイメージ要素が
特定のクラスに属する確率として解釈される値を与える
出力が算出される。十分に訓練されたニューラル・ネッ
トは、訓練中に使用されたイメージ要素だけでなく、初
めて表示されたイメージ要素も分類することができる。
マルチレイヤ・フィードフォワード・ネットなどの最新
の人工ニューラル・ネットワークを使用して、極めて良
好な認識率が達成されている。
【0024】複数の出力を備えた他のネットワーク・ア
ーキテクチャを使用して、訓練プロセス中に提示された
各イメージ要素クラスの確率値を算出することができ
る。クラス・メンバシップが、イメージ要素と共に記憶
され、以後の処理中に使用される。認識されるクラスは
たとえば、線、スタンプ、署名、手書きテキスト、印刷
テキストなどの文書部分である。
【0025】<分類フィードバック>この時点で、フィ
ードバック・ループを組み込むことができる。各イメー
ジ要素ごとに特定のクラス・メンバシップの確率が分か
っている場合、この値を追加特徴として使用することが
できる。そのために、固定半径によって与えられる領域
の内部にある各イメージ要素から、特定のクラスの確率
値の平均が算出される。これらの特徴も、使用されたニ
ューラル・ネットに送られ、認識率を大幅に改善する。
分類ステップは、安全な結果が達成されるまでの、前述
のステップの複数回の繰返しを含むことができる。
【0026】結果として得られるイメージ要素は、この
ステップまたは前のステップの後に再びグループ化する
ことができる。この組合せは、イメージ要素のサイズ、
位置、または特徴に基づいて行われる。対応するイメー
ジ要素のグループをイメージ・クラスタと呼ぶ。図4
に、多数のイメージ要素411、412、413、42
1、422、423、424、425、およびそれらに
対応するクラスタ41、42の例を示す。
【0027】<クリーニング>最終ステップは、希望し
ないクラス・メンバシップをもつイメージ要素の除去で
ある。1つのイメージ要素が別のイメージ要素で完全に
囲まれる、あるいは2つの異なるイメージ要素が、図3
に示すようにその周囲領域に交差部をもつことがある。
そのため、除去するすべてのイメージ要素を、除去され
ない他のイメージ要素との交差部があるか否か検査す
る。周囲領域の間に交差部をもつ各イメージ要素対が、
いくつかの新しいイメージ要素と置き換えられる。それ
らのイメージ要素の合計は元のイメージ要素対を構成す
るが、新しい要素は周囲領域に交差部をもたない。交差
領域自体は、両方のイメージ要素のうち一方の一部とし
て残る。図5および6に、このプロセスの例を示す。図
5には、矩形51と、交差部512を有する別の矩形5
2を示す。矩形51は、図6に示すように2つの矩形5
11と513に分割される。交差領域512は矩形52
2に追加され、前の矩形551の一部ではなくなる。こ
れは、図6の矩形522内の領域512を囲む破線52
3で示されている。これらの作成中に、新しいイメージ
要素511、513、522が、元の要素の分類を継承
する。見つかったすべての交差部についてこのプロセス
を繰り返した後、結果として得られる1組のイメージ要
素を探索し、希望しないすべてのイメージ要素を除去す
ることができる。
【0028】<応用側>前述の本発明の方法を使用し
て、イメージを明確な多数のイメージ要素にセグメント
化することが可能である。このプロセス中に小さな要素
が破棄されることを利用して、イメージから背景雑音を
削除することができる。
【0029】イメージ要素サイズに関する情報に基づ
き、垂直または水平線などの単純な形の要素を見つける
ことができる。この情報を使用すると、文書から他の部
分を抽出する前に、基本文書タイプを認識し線を除去し
ておくことができる。
【0030】特徴に基づく分類を使用して、イメージ要
素の数およびクラスなどイメージ内容に関する情報を計
算することができる。この機能を使用して、イメージの
あらゆる部分とイメージ全体を分類することが可能であ
る。適用業務はこの方法を使用し、印刷物、手書きした
もの、図面、または写真などの複雑なイメージを区別す
ることができる。
【0031】分類されたイメージ要素は、光学式文字認
識や手書き認識など以後の処理のために抽出することが
可能である。イメージ要素の位置が分かっているので、
基礎文書構造に関する必要な情報は少なくなる。
【0032】自動署名確認システムは、この方法を使用
して、1つまたは複数の署名を見つけ、文書イメージか
ら抽出することができる。クラスタ化を使用して、各署
名のイメージ要素を分離する。
【図面の簡単な説明】
【図1】小文字"e"の強度ピクセル・マトリックスを示
す図である。
【図2】値が小さすぎるイメージ要素接続部を検出する
ための方式の概略図である。
【図3】相互に貫通する矩形イメージ領域の例を示す概
略図である。
【図4】典型的なテキスト行で見られるイメージ要素の
典型的な例を示す図である。
【図5】交差する矩形とその記録を示す図である。
【図6】交差する矩形とその記録を示す図である。
【符号の説明】
10 文字"e" 13 線 14 領域 21 ラン 22 ラン 23 ラン 24 ラン 25 ラン 26 ラン 27 ラン 28 領域 29 領域 31 周囲領域 32 周囲領域 33 周囲領域 34 イメージ要素 35 イメージ要素 36 イメージ要素 41 矩形領域 42 矩形領域 51 矩形 52 矩形

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】特に、手書き情報の文字認識を行う前、特
    に署名を分析し認識する前に、書式要素、線、印刷文字
    などの不要な情報を文書から除去するための、文書処理
    用のイメージ・セグメント化およびイメージ要素分類方
    法であって、 1)イメージをイメージ要素にセグメント化するステッ
    プと、 2)各イメージ要素から特徴情報を抽出するステップ
    と、 3)ステップ1)で得られた各イメージ要素を分類する
    ステップと、 4)不要な情報として分類されたイメージ要素を除去す
    るステップとを含むことを特徴とする方法。
  2. 【請求項2】ステップ1)のセグメント化が、各イメー
    ジ要素を探索し、見つかった各イメージ要素を、以後の
    処理のために記憶することによって実行されることを特
    徴とする、請求項1に記載の方法。
  3. 【請求項3】前記分類が、請求項1のステップ2で生成
    された特徴情報に基づいて行われ、文脈に対応して実行
    されることを特徴とする、請求項1または2に記載の方
    法。
  4. 【請求項4】セグメント化ステップについて、文書の完
    全なイメージのピクセル・アレイが水平および垂直方向
    に走査され、通常はほぼ同じ強度をもつ複数のピクセル
    から構成される各イメージ要素が、同じイメージ要素に
    属する場合に探索されることを特徴とする、請求項1、
    2、または3に記載の方法。
  5. 【請求項5】ピクセルが、 a)線の方向に検査され、急激な方向の変化および該変
    化の位置が、記憶され、ピクセル接続部が切断される破
    断点として認識され、あるいは b)平行ランで検査され、そのような2つのランのピク
    セル間の境界が計算され、その長さが一定のしきい値を
    下回る場合、ピクセル接続部が切断され、あるいは c)前記のステップa)とb)の両方の組合せで検査さ
    れ、同じ要素に属していないイメージ要素を分離するこ
    とを特徴とする、請求項4に記載の方法。
  6. 【請求項6】必要最小サイズを下回るか、あるいは有効
    な情報を含んでいないイメージ要素が、好ましくはただ
    ちに廃棄され、したがってイメージ中の背景雑音が除去
    され、イメージ要素の数が少なめに維持されることを特
    徴とする、前記いずれかの請求項に記載の方法。
  7. 【請求項7】各イメージ要素からの前記特徴抽出が、大
    抵の場合はセグメント化プロセス中にただちに実行され
    ることを特徴とする、前記いずれかの請求項に記載の方
    法。
  8. 【請求項8】単一のイメージ要素とその近隣イメージ要
    素の関係を記述する近隣特徴値と、イメージ要素自体の
    特性を記述するローカル特徴値を計算することを特徴と
    する、請求項7に記載の方法。
  9. 【請求項9】近隣特徴値として、特定の方向の近隣イメ
    ージ要素の数が計算され、該近隣イメージ要素の数が、
    ほぼ同じサイズ特性をもつイメージ要素だけのカウント
    と組み合わせて、印刷テキストを示すことができること
    を特徴とする、請求項8に記載の方法。
  10. 【請求項10】ローカル特徴として、 イメージ要素の最大水平および垂直エクステンションに
    よって記述される矩形領域中の前景ピクセルの数と背景
    ピクセルの数の比である密度特徴、または特定の方向に
    ついての高強度と低強度の間の変化の平均数によって与
    えられ、イメージ要素に属する線分の数を表す、垂直お
    よび水平方向の複雑度特徴、またはイメージ要素の包絡
    線の幅と高さの商である縦横比特徴あるいはそれらの組
    合せが計算されることを特徴とする、請求項8または9
    に記載の方法。
  11. 【請求項11】各ローカル特徴値が対応する近隣特徴値
    等価物を有し、前記等価物が、固定半径によって与えら
    れる領域の内部の各イメージ要素のローカル特徴値の平
    均として算出され、前記の算出された特徴値がその固有
    距離で加重されることを特徴とする、請求項8、9、ま
    たは10に記載の方法。
  12. 【請求項12】分類ステップが、人工ニューラル・ネッ
    トワーク、好ましくはマルチレイヤ・フィードフォワー
    ド・ネットによって実行されることを特徴とする、前記
    いずれかの請求項に記載の方法。
  13. 【請求項13】前記分類ステップにおいて、各イメージ
    要素の特徴値が人工ニューラル・ネットに送られ、内部
    で加重され、その特徴・セットのイメージ要素が特定の
    クラスに属する確率を示す値を与える出力が算出される
    ことを特徴とする、前記いずれかの請求項に記載の方
    法。
  14. 【請求項14】複数の出力をもつ人工ニューラル・ネッ
    トワークを使用する前記分類において、ニューラル・ネ
    ットワークの訓練中に提示された各イメージ要素クラス
    の確率値が算出され、各イメージ要素のクラス・メンバ
    シップがイメージ要素と共に、以後の処理のために記憶
    され、その際に、認識され記憶されるクラスが、線、ス
    タンプ、署名、手書きテキスト、印刷テキストなどの文
    書部分であることを特徴とする、前記いずれかの請求項
    に記載の方法。
  15. 【請求項15】前記分類ステップが、好ましくは安定し
    た結果が達成されるまで、複数回繰り返されることを特
    徴とする、請求項13または14に記載の方法。
  16. 【請求項16】好ましくは、固定半径によって与えられ
    る領域の内部にある各イメージ要素の特定のクラスの確
    率値の平均値を算出することによって、各イメージ要素
    の特定のクラス・メンバシップの既知の確率値を追加特
    徴値として使用することによってフィードバックを組み
    込み、これらの特徴値も前記ニューラル・ネットワーク
    に送って、認識率をさらに改善することを特徴とする、
    請求項13、14、または15に記載の方法。
  17. 【請求項17】分類されたイメージ要素が、対応するイ
    メージ要素のクラスタにグループ化され、前記グループ
    化が、好ましくはサイズ、位置、または関連する特徴値
    に関する情報に基づいて行われることを特徴とする、請
    求項12ないし16のいずれかに記載の方法。
  18. 【請求項18】不要なイメージ要素を除去する前に、そ
    れらの要素が、除去されない他のイメージ要素との交差
    について検査されることを特徴とする、前記いずれかの
    請求項に記載の方法。
  19. 【請求項19】交差するイメージ要素の対が、交差部を
    もたないいくつかの新しいイメージ要素で置き換えら
    れ、交差する領域自体が元のイメージ要素の対の一部と
    されることを特徴とする、請求項18に記載の方法。
JP6104202A 1993-06-30 1994-05-18 文書処理のためのイメージ・セグメント化およびイメージ要素分類の方法 Expired - Fee Related JP2802036B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE93110476.4 1993-06-30
EP93110476A EP0632402B1 (en) 1993-06-30 1993-06-30 Method for image segmentation and classification of image elements for document processing

Publications (2)

Publication Number Publication Date
JPH0728940A true JPH0728940A (ja) 1995-01-31
JP2802036B2 JP2802036B2 (ja) 1998-09-21

Family

ID=8213028

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6104202A Expired - Fee Related JP2802036B2 (ja) 1993-06-30 1994-05-18 文書処理のためのイメージ・セグメント化およびイメージ要素分類の方法

Country Status (9)

Country Link
US (1) US5751850A (ja)
EP (1) EP0632402B1 (ja)
JP (1) JP2802036B2 (ja)
KR (1) KR0131279B1 (ja)
AT (1) ATE196205T1 (ja)
BR (1) BR9402595A (ja)
CA (1) CA2113751C (ja)
DE (1) DE69329380T2 (ja)
ES (1) ES2150926T3 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018538623A (ja) * 2015-12-11 2018-12-27 シキューブ カンパニー,リミテッド 時分割セグメントブロック基盤手記署名認証システムおよび方法

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5982943A (en) * 1992-09-14 1999-11-09 Startek Eng. Inc. Method for determining background or object pixel for digitizing image data
US5946415A (en) * 1996-10-24 1999-08-31 The United States Of America As Represented By The Secretary Of The Army Method and apparatus to process drawing images
US6389175B1 (en) 1996-12-19 2002-05-14 At&T Laboratories, Limited Method for encoding digital information
GB9626359D0 (en) * 1996-12-19 1997-02-05 Olivetti Telemedia Spa Method for encoding digital information
US6324302B1 (en) * 1997-05-30 2001-11-27 Ricoh Company, Ltd. Method and a system for substantially eliminating erroneously recognized non-solid lines
US6137911A (en) * 1997-06-16 2000-10-24 The Dialog Corporation Plc Test classification system and method
DE19828396C2 (de) 1998-06-25 2000-04-27 Computer Ges Konstanz Verfahren zum Verarbeiten von Bilddaten
US20020164070A1 (en) * 2001-03-14 2002-11-07 Kuhner Mark B. Automatic algorithm generation
US7139755B2 (en) 2001-11-06 2006-11-21 Thomson Scientific Inc. Method and apparatus for providing comprehensive search results in response to user queries entered over a computer network
US7113636B2 (en) * 2002-08-30 2006-09-26 Lockheed Martin Corporation Method and computer program product for generating training data for a new class in a pattern recognition classifier
JP4538214B2 (ja) * 2002-11-22 2010-09-08 オセ−テクノロジーズ・ベー・ヴエー グラフによる画像分割
JP2008503796A (ja) * 2003-12-31 2008-02-07 トムソン グローバル リソーシーズ 最初のクエリによって規定されたバウンダリーを越えて検索結果を拡張するためのシステム、方法、インターフェース、およびソフトウェア
JP4172584B2 (ja) * 2004-04-19 2008-10-29 インターナショナル・ビジネス・マシーンズ・コーポレーション 文字認識結果出力装置、文字認識装置、その方法及びプログラム
DE102005010076A1 (de) * 2005-03-04 2006-09-07 Siemens Ag Bildbearbeitungsverfahren für ein digitales medizinisches Untersuchungsbild und zugehörige Untersuchungseinrichtung
US7599556B2 (en) * 2005-08-25 2009-10-06 Joseph Stanley Czyszczewski Apparatus, system, and method for scanning segmentation
JPWO2008044524A1 (ja) * 2006-10-10 2010-02-12 株式会社ニコン 画像分類プログラム、画像分類装置および電子カメラ
US8467614B2 (en) * 2007-11-28 2013-06-18 Lumex As Method for processing optical character recognition (OCR) data, wherein the output comprises visually impaired character images
US8396296B2 (en) * 2007-12-31 2013-03-12 Intel Corporation Brand image detection
CN101826160B (zh) * 2010-03-31 2012-11-14 北京航空航天大学 基于免疫进化策略的高光谱图像分类方法
US20130194448A1 (en) * 2012-01-26 2013-08-01 Qualcomm Incorporated Rules for merging blocks of connected components in natural images
US9064191B2 (en) 2012-01-26 2015-06-23 Qualcomm Incorporated Lower modifier detection and extraction from devanagari text images to improve OCR performance
US9076242B2 (en) 2012-07-19 2015-07-07 Qualcomm Incorporated Automatic correction of skew in natural images and video
US9183458B2 (en) 2012-07-19 2015-11-10 Qualcomm Incorporated Parameter selection and coarse localization of interest regions for MSER processing
US9262699B2 (en) 2012-07-19 2016-02-16 Qualcomm Incorporated Method of handling complex variants of words through prefix-tree based decoding for Devanagiri OCR
US9047540B2 (en) 2012-07-19 2015-06-02 Qualcomm Incorporated Trellis based word decoder with reverse pass
US9141874B2 (en) 2012-07-19 2015-09-22 Qualcomm Incorporated Feature extraction and use with a probability density function (PDF) divergence metric
US9418281B2 (en) 2013-12-30 2016-08-16 Google Inc. Segmentation of overwritten online handwriting input
US9286527B2 (en) 2014-02-20 2016-03-15 Google Inc. Segmentation of an input by cut point classification
DE112015006638T5 (de) * 2015-07-17 2018-03-08 Mitsubishi Electric Corporation Animationsanzeigevorrichtung und animationsanzeigeverfahren
US10242503B2 (en) 2017-01-09 2019-03-26 Snap Inc. Surface aware lens
US11030813B2 (en) 2018-08-30 2021-06-08 Snap Inc. Video clip object tracking
US11176737B2 (en) 2018-11-27 2021-11-16 Snap Inc. Textured mesh building
EP3899865A1 (en) * 2018-12-20 2021-10-27 Snap Inc. Virtual surface modification
US11189098B2 (en) 2019-06-28 2021-11-30 Snap Inc. 3D object camera customization system
US11232646B2 (en) 2019-09-06 2022-01-25 Snap Inc. Context-based virtual object rendering
CN110853047B (zh) * 2019-10-12 2023-09-15 平安科技(深圳)有限公司 智能图像分割及分类方法、装置及计算机可读存储介质
US11227442B1 (en) 2019-12-19 2022-01-18 Snap Inc. 3D captions with semantic graphical elements
US11263817B1 (en) 2019-12-19 2022-03-01 Snap Inc. 3D captions with face tracking

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6068479A (ja) * 1983-05-31 1985-04-19 アール・オー・シー・シー・パターン・レコグニション・リミテッド 署名照合装置
JPS62165284A (ja) * 1986-01-17 1987-07-21 Hitachi Ltd 文字列抽出方式
JPS63157287A (ja) * 1986-12-20 1988-06-30 Ricoh Co Ltd 文字パタ−ン抽出方法
JPH0259979A (ja) * 1988-08-26 1990-02-28 Toshiba Corp 文書画像処理装置
JPH02253383A (ja) * 1989-03-27 1990-10-12 Matsushita Electric Ind Co Ltd 画像処理装置
JPH04114560A (ja) * 1990-09-04 1992-04-15 Sharp Corp 自動文書入力装置
JPH0567201A (ja) * 1990-10-27 1993-03-19 Internatl Business Mach Corp <Ibm> 署名を自動検証する方法と装置
JPH05128305A (ja) * 1991-11-07 1993-05-25 Matsushita Electric Ind Co Ltd 領域分割方法

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6019285A (ja) * 1983-07-13 1985-01-31 Oki Electric Ind Co Ltd ストロ−ク抽出方法
JPS60181883A (ja) * 1984-02-29 1985-09-17 Oki Electric Ind Co Ltd 文字認識におけるストロ−ク抽出方法
JPS61193277A (ja) * 1985-02-20 1986-08-27 Mitsubishi Electric Corp 文書読取装置
US5046114A (en) * 1985-10-01 1991-09-03 The Palantir Corporation Method and structure for separating joined patterns for use in pattern and character recognition system
US4769849A (en) * 1985-12-19 1988-09-06 The Palantir Corporation Method and apparatus for separating overlapping patterns
JPS62274481A (ja) * 1986-05-23 1987-11-28 Ricoh Co Ltd 不要画像の消去方法
WO1988002157A1 (en) * 1986-09-19 1988-03-24 Arthur Wheeler Holt Character and pattern recognition machine and method
JPS63229584A (ja) * 1987-03-19 1988-09-26 Matsushita Electric Ind Co Ltd 文字認識装置
JPS6465679A (en) * 1987-09-07 1989-03-10 Oki Electric Ind Co Ltd On-line character recognizing device
JP2619429B2 (ja) * 1987-11-05 1997-06-11 グローリー工業株式会社 接触文字の分離方法
US4888812A (en) * 1987-12-18 1989-12-19 International Business Machines Corporation Document image processing system
JP2822189B2 (ja) * 1988-05-19 1998-11-11 ソニー株式会社 文字認識装置及び方法
JPH0821059B2 (ja) * 1988-07-06 1996-03-04 富士通株式会社 文字輪郭生成時の不要データ除去方式
DE3881392T2 (de) * 1988-09-12 1993-10-21 Oce Nederland Bv System und Verfahren für automatische Segmentierung.
US5005946A (en) * 1989-04-06 1991-04-09 Grumman Aerospace Corporation Multi-channel filter system
US5267328A (en) * 1990-01-22 1993-11-30 Gouge James O Method for selecting distinctive pattern information from a pixel generated image
JPH03282985A (ja) * 1990-03-30 1991-12-13 Glory Ltd 手書き数字認識における雑音処理方式
JPH0438587A (ja) * 1990-06-04 1992-02-07 Nec Corp 入力領域適応型ニューラルネットワーク文字認識装置
JP2868134B2 (ja) * 1990-09-03 1999-03-10 キヤノン株式会社 画像処理方法及び装置
US5272766A (en) * 1991-01-14 1993-12-21 Ncr Corporation OCR system for recognizing user-specified custom fonts in addition to standard fonts using three-layer templates
US5105468A (en) * 1991-04-03 1992-04-14 At&T Bell Laboratories Time delay neural network for printed and cursive handwritten character recognition
JPH0618188A (ja) * 1992-01-27 1994-01-25 Mitsui Mining & Smelting Co Ltd ヘッダープレート用銅合金及びそれを用いた熱交換器
US5337370A (en) * 1992-02-28 1994-08-09 Environmental Research Institute Of Michigan Character recognition method employing non-character recognizer
US5245672A (en) * 1992-03-09 1993-09-14 The United States Of America As Represented By The Secretary Of Commerce Object/anti-object neural network segmentation
US5442715A (en) * 1992-04-06 1995-08-15 Eastman Kodak Company Method and apparatus for cursive script recognition
JP2769068B2 (ja) * 1992-06-18 1998-06-25 日本エヌエスシー株式会社 カチオン性マイクロエマルジョン組成物およびその製法
US5321768A (en) * 1992-09-22 1994-06-14 The Research Foundation, State University Of New York At Buffalo System for recognizing handwritten character strings containing overlapping and/or broken characters
JPH06119327A (ja) * 1992-10-06 1994-04-28 Fuji Xerox Co Ltd 文書処理装置
JP2977691B2 (ja) * 1993-02-05 1999-11-15 株式会社クボタ 作業車のフレーム構造
JPH06322958A (ja) * 1993-05-13 1994-11-22 Sanyo Electric Co Ltd 採光システム
US5434927A (en) * 1993-12-08 1995-07-18 Minnesota Mining And Manufacturing Company Method and apparatus for machine vision classification and tracking

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6068479A (ja) * 1983-05-31 1985-04-19 アール・オー・シー・シー・パターン・レコグニション・リミテッド 署名照合装置
JPS62165284A (ja) * 1986-01-17 1987-07-21 Hitachi Ltd 文字列抽出方式
JPS63157287A (ja) * 1986-12-20 1988-06-30 Ricoh Co Ltd 文字パタ−ン抽出方法
JPH0259979A (ja) * 1988-08-26 1990-02-28 Toshiba Corp 文書画像処理装置
JPH02253383A (ja) * 1989-03-27 1990-10-12 Matsushita Electric Ind Co Ltd 画像処理装置
JPH04114560A (ja) * 1990-09-04 1992-04-15 Sharp Corp 自動文書入力装置
JPH0567201A (ja) * 1990-10-27 1993-03-19 Internatl Business Mach Corp <Ibm> 署名を自動検証する方法と装置
JPH05128305A (ja) * 1991-11-07 1993-05-25 Matsushita Electric Ind Co Ltd 領域分割方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018538623A (ja) * 2015-12-11 2018-12-27 シキューブ カンパニー,リミテッド 時分割セグメントブロック基盤手記署名認証システムおよび方法

Also Published As

Publication number Publication date
DE69329380T2 (de) 2001-03-01
KR0131279B1 (ko) 1998-04-24
CA2113751A1 (en) 1994-12-31
KR950001551A (ko) 1995-01-03
EP0632402B1 (en) 2000-09-06
ES2150926T3 (es) 2000-12-16
EP0632402A1 (en) 1995-01-04
JP2802036B2 (ja) 1998-09-21
CA2113751C (en) 1999-03-02
ATE196205T1 (de) 2000-09-15
DE69329380D1 (de) 2000-10-12
BR9402595A (pt) 1995-06-20
US5751850A (en) 1998-05-12

Similar Documents

Publication Publication Date Title
KR0131279B1 (ko) 문서처리 방법
Tensmeyer et al. Historical document image binarization: A review
US6731788B1 (en) Symbol Classification with shape features applied to neural network
DE69724755T2 (de) Auffinden von Titeln und Photos in abgetasteten Dokumentbildern
DE3926327C2 (de) Verfahren und System zum Erkennen von Zeichen auf einem Medium
EP1146478B1 (en) A method for extracting titles from digital images
CN111401353B (zh) 一种数学公式的识别方法、装置及设备
WO2001037212A1 (en) Video stream classifiable symbol isolation method and system
CN101122952A (zh) 一种图片文字检测的方法
Prusty et al. Indiscapes: Instance segmentation networks for layout parsing of historical indic manuscripts
JPH05225378A (ja) 文書画像の領域分割システム
CN109886978A (zh) 一种基于深度学习的端到端告警信息识别方法
Kaur et al. Text and graphics segmentation of newspapers printed in Gurmukhi script: a hybrid approach
Rahman et al. Bn-htrd: A benchmark dataset for document level offline bangla handwritten text recognition (htr) and line segmentation
Seraogi et al. Employing CNN to Identify Noisy Documents Thereafter Accomplishing Text Line Segmentation
Ghanei et al. Localizing scene texts by fuzzy inference systems and low rank matrix recovery model
Van Phan et al. Collecting handwritten nom character patterns from historical document pages
Okun et al. A survey of texture-based methods for document layout analysis
Jia et al. Grayscale-projection based optimal character segmentation for camera-captured faint text recognition
Dey et al. Margin noise removal from printed document images
Bouressace et al. A convolutional neural network for Arabic document analysis
Reisswig et al. Chargrid-OCR: End-to-end trainable optical character recognition for printed documents using instance segmentation
Wang et al. A multi-stage method for Chinese text detection in news videos
CN116994261B (zh) 一种大数据精准教学智能题卡图像智能识别系统
Ghai et al. Comparison of Different Text Extraction Techniques for Complex Color Images

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees