JPH06301781A - コンピュータによるパターン認識のためのイメージ変換方法及び装置 - Google Patents

コンピュータによるパターン認識のためのイメージ変換方法及び装置

Info

Publication number
JPH06301781A
JPH06301781A JP6007388A JP738894A JPH06301781A JP H06301781 A JPH06301781 A JP H06301781A JP 6007388 A JP6007388 A JP 6007388A JP 738894 A JP738894 A JP 738894A JP H06301781 A JPH06301781 A JP H06301781A
Authority
JP
Japan
Prior art keywords
projection
image
shadow
boundary
projections
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6007388A
Other languages
English (en)
Inventor
Klaus Rindtorff
クラウス・リンドトルッフ
Volker Rudolph
フォルカー・ルドルフ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH06301781A publication Critical patent/JPH06301781A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/30Writer recognition; Reading and verifying signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • G06V30/18095Summing image-intensity values; Projection and histogram analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2264Character recognition characterised by the type of writing of cursive writing using word shape
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques

Abstract

(57)【要約】 【目的】 コンピュータによるパターン認識のためにイ
メージを変換する改良された方法を提供する。 【構成】 変換されたイメージの境界及び影を定義する
ために少なくとも2つの異なる投影が実行される。変換
されたイメージは検査されるパラメータ値の計算のよう
な爾後の分析の基礎となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は分類又はパターン認識の
ためにイメージを自動的に変換する方法及び装置、特に
手書き又は機械印刷のテキストを自動的に検査又は認識
する方法に関する。
【0002】
【従来の技術】US-A-4,523,331は、自動化されたイメー
ジ入力(認識を含む)、記憶及び出力(イメージ生成を
含む)のコンピュータアルゴリズム及び装置を開示して
いる。各イメージは一意の二進数に変換され記憶され
る。手書きイメージ及びカラーイメージを処理する手段
も開示されている。イメージ認識及び突合わせは、新し
いイメージの2進値を、2進値の差の下降順に記憶され
た全てのイメージと比較することにより行われる。従っ
て、コンピュータは理想的な又は一方に記憶されたサン
プルと新しいイメージの間の相違が一貫性のない実体で
あるときでさえも不完全な筆跡を認識できる。コンピュ
ータはそのエラーならびにユーザから受取った訂正のデ
ータも記憶する。
【0003】US-A-4,654,873は、手書き文字が電気的に
2次元イメージパターンに変換されるパターン分割及び
認識システムを開示している。この場合、イメージパタ
ーンから文字を含む単位パターンを分割する際に曖昧さ
が存在する場合、文字認識は強制的には行われないが、
複数の可能な単位パターンが最初に確立される。次い
で、種々の単位パターンが分割され、そして各単位パタ
ーンが部分パターン、リンクされたパターン等であるか
を識別される。それによって、各文字は総合的判断に基
づいて認識されるので、分割の曖昧さが解決される。
【0004】US-A-4,972,499は、入力パターンをセグメ
ントに分割する外形分割装置と、入力セグメントの特性
を引出す特性引出装置と、基準パターンの特性データを
記憶する基準装置とを備えるパターン認識装置を開示し
ている。基準装置は主要基準及び細部整合基準を含む。
主要基準は各基準パターンのセグメントの特性を表わす
部分的なパターン特性データを記憶する。細部整合基準
は各基準パターンの細部特性データをその操作手順を指
定するプログラムと一緒に記憶する。整合プロセッサは
順次に入力パターンと基準パターンを比較・照合し、入
力パターンが最大の類似性で突合わされる基準パターン
を捜し出す。入力パターンが幾つかの基準パターンと突
合わされるとき、細部認識装置はこれらの基準パターン
の細部特性データを用いて細部認識プロセスを実行し、
基準パターンのなかから最終的に正しいものを選択す
る。主要基準は更に上記細部特性データの取得に必要な
特定の基準セグメントを識別する識別マークを記憶す
る。
【0005】US-A-4,769,716は、走査された記号のファ
クシミリを伝送する改良された方法を開示している。各
走査された記号の表示と以前に生成されたその記号のそ
れぞれの原型ファクシミリとを平均化することにより、
ライブラリ内の各記号の原型ファクシミリが改良され
る。各記号の原型の反対側における白空間の量が決定さ
れる。各走査された記号の改良された原型ファクシミリ
は、各記号の前記反対側における平均の白空間を示す位
置パラメータと関連づけられる。
【0006】US-A-4,718,103は、セグメントを含む多角
形の線の連続に近似の手書きパターンとメモリに記憶さ
れた辞書パターンから選択された候補パターンとを、両
パターンの隣接セグメントの間の角変化に基づいて比較
するシステムを開示している。両パターンの隣接したセ
グメントの角変化の間の差が一定の範囲の外にある場
合、3以上の連続したセグメントにわたる角変化と基準
角変化の間の差が前記範囲内にあるかどうかが検査され
る。
【0007】US-A-4,653,107は、パターン座標データを
作成するパターン認識装置により、タブレットに作図さ
れた手書きのパターンの座標を順次にサンプリングする
システムを開示している。サンプリングされた1つのス
トロークのパターン座標データにより生成されたセグメ
ントと前記1つのストロークの座標データの始点及び終
点を接続する線とに囲まれた領域に基づいて、サンプリ
ングされた1つのストロークのパターン座標データが直
線又は曲線セグメント又は両者に変換される。変換され
たセグメントは量子化され正規化される。正規化された
入力パターンのセグメントは入力パターンが所定のシー
ケンスで作図されるように再配置される。再配置された
セグメントの方角の差が計算される。これらの差はメモ
リから読取られた辞書パターンの方角の差と比較され、
それらの間の差を計算する。この差に従って入力パター
ンと辞書パターンの整合が決定される。整合が失敗する
場合、認識プロセスを続けるために、最初又は最後に入
力された入力パターンのセグメントが削除されるか、又
は次のストロークのサンプリングされたパターン座標が
付加される。
【0008】US-A-4,284,975は、手書きの文字、特に書
込まれた入力文字のストローク上の複数の点の座標を提
供する文字入力装置を備える、手書きの漢字に関してオ
ンラインで動作するパターン認識システムと、3ストロ
ークに等しいか又はそれよりも少ないストロークを有す
る第1のグループ及び4ストロークに等しいか又はそれ
よりも多いストロークを有する第2のグループに入力文
字を分類する分類装置と、ストロークの数が第1の文字
のグループ内のストローク毎に6であり且つ第2の文字
のグループ内のストローク毎に3である、複数の特性点
をストロークの各々に提供する概算装置と、入力文字の
特性点及び、基準パターン記憶装置に記憶されている基
準文字の特性点の間の長さの合計を提供するパターン差
計算器と、このように計算されたパターン差の間の最小
の長さを決定する最小差検出器とを開示している。入力
文字は前記最小の長さを提供する基準文字と同じである
ことが認識される。
【0009】US-A-4,972,496は、スタイラスが接触する
と位置情報を生成する透明な入力画面、及び表示される
文字を入力画面の下方に見ることができるように入力画
面の下に物理的に取付けられた表示画面を備えるキーボ
ードレス入力コンピュータシステムを開示している。こ
のシステムは位置情報を編集してストロークにし、スト
ローク特性を計算し、そしてスタイラスで描かれた記号
を認識するためにこのストローク特性とデータベースに
記憶されたストローク特性とを比較するようにプログラ
ムされているコンピュータを備える。このシステムの重
要な特性は、(1) 透明な位置感知サブシステム、(2) 感
知された位置を模倣して作図し且つ文字又は記号を示す
ための下方の表示画面、(3) 感知された位置を最初にプ
ロットされた点に、次いで認識される文字又は記号に変
換する手段、及び(4) 感知された入力位置と文字又は記
号とを関連づけるように "学習" する手段である。
【0010】IBM 社の欧州特許出願第92 116 605.4(未
公開)は原型混乱性対話を用いる筆跡認識システムを開
示している。この特許出願の主題は原型空間内で互いに
接近している原型の対話式編集の手順及び原型突合わせ
による筆跡のオンライン認識に関する。
【0011】EP-A-0,483,391から、個人の署名を自動的
に検査する方法及びこの方法を実行する装置が知られて
いる。基準署名分析モードで、基準直径値のセットを記
憶するために個人の1つ以上の基準署名が処理される。
このモードは前記基準パラメータ値に基づいた将来の検
査の基礎を与える。署名検査モードで、検査されるパラ
メータ値のセットを生成するために個人の1つの現在の
署名が処理される。記憶された基準パラメータ値のセッ
ト及び検査されるパラメータ値の対応するセットによ
り、対応する基準署名に関して現在の署名の真偽が判定
される。
【0012】筆記体の手書き筆跡又は他のタイプの手書
き又は印刷テキストの認識を意図する自動システムの成
功ははこれまでは限られたものであった。その理由は、
主として、筆跡のモデル化で用いられたテンプレート及
びパラメータで表示された堅固さの不足によることがあ
る。例えば、ランオン手書き文字を認識する3ステップ
の手順を開示しているUS-A-4,731,857を参照されたい。
この認識アルゴリズムは動的プログラミングに基づいた
テンプレート突合わせアルゴリズムである。各テンプレ
ートはたぶんこの文字を形成する筆記者の平均的な流儀
を表わす完全に形成された文字であり、そして現在の文
字の融通性のある一致スコアが各テンプレートについて
計算される。この方式は筆記者及び時間の両者にわたっ
て観察し得る広範囲の可変性に弱い。
【0013】
【発明が解決しようとする課題】本発明の目的は自動的
な分類又はパターン認識のためにイメージを変換する改
良された方法を提供することにある。
【0014】
【課題を解決するための手段】本発明により、署名のよ
うな、テキスト又はワード、ないしはワードのセグメン
トの影が少なくとも2つの投影により生成される。テキ
ストの原始イメージは、その影又は複数の影と一緒に、
変換されたイメージを生じる。影が分類又は認識に特に
関連するのは、それがイメージのかなりの領域を強調す
るからである。よって、影の位置、サイズ又は境界、あ
るいはその任意の組合せを用いてそのイメージが特性を
与えられ分類される。
【0015】良好に用いられる投影の種類は平行投影で
あるが、イメージの影を生じる他のどのタイプの投影も
適合する。
【0016】本発明の良好な実施例により、影の内部の
構造が分析される。この分析は、その影が原始イメージ
の部分をカバーするかどうかを判定する。そのために、
2つの代替方法が考案されている。
【0017】第1の方法では、影の境界の部分に実質的
に直交する方向に1つ又はそれ以上の投影が実行され
る。反復毎に、影の一定の領域が削除される。このプロ
セスの特定の反復で削除される特定の領域が識別子を割
当てられる。その領域の識別子は、分析される完全な構
造の範囲内の影のこの特定の部分の複雑さに関する情報
を含む。
【0018】第2の方法では、原始イメージの境界によ
り完全に限界を画されている影の内部構造が分析され
る。よって、当該限界を画されている境界の一部分が削
除され、更に投影が実行される。それによって削除され
る影の領域に再び識別子が割当てられる。削除とそれに
続く投影の動作が反復して実行される。
【0019】本発明の方法はテキスト分割、例えば個々
のワード又は文字の分割にも用いられる。変換されたイ
メージにあるギャップは個々のセグメントの範囲を定め
るのに役立つ。
【0020】本発明の方法はイタリック字体又は記号か
らなる筆記体のテキストの傾斜の決定にも用いられる。
実行される投影の少なくとも1つが筆記体のテキストの
傾斜にほぼ等しい斜角を有する基準線を有する場合、そ
れによって生じる影は最小になる。この場合にのみ、こ
の種の投影が筆記体テキストの分割にも重要になるよう
に筆記体のテキストの変換されたイメージにギャップが
生じる。
【0021】本発明の方法はイメージ分類及び認識、及
び特に手書きのテキスト及び署名の認識を処理する必要
がある多数の異なる環境で有利に用いられる。前述の従
来の技術の説明から明らかなように、従来の技術の方法
の多くは、特性パラメータを生成するために一定のイメ
ージ変換形式を用いる。一般にこれらのパラメータの値
は、例えば署名を検査又は認識するために対応する基準
パラメータの値と比較される。一般に、これらの基準パ
ラメータの値は、検査されるパラメータの値の計算に役
立つ方法よりもイメージ変換とそれに続くパラメータ計
算に同じ方法を用いる調整セッションで生成される。こ
れは特にEP-A-0,483,391、US-A-4,523,331、UA-A-4,97
2,499、US-A-4,284,975、US-A-4,972,496及びUS-A-4,73
1,857に当てはまる。
【0022】本発明の方法は既知の方法をイメージの変
換に置き換えるので、これらの従来の方法の性能を改善
するのに適合する。特に、EP-A-0,483,391に記述された
方法は、検査されるパラメータの値がディジタル化され
たイメージから直に計算されずに本発明によって変換さ
れるイメージから変換される場合に改善される。
【0023】
【実施例】図1に示す署名のイメージを本発明に従って
変換する方法について図2〜5を参照して以下に説明す
る。図2に示すように、上からの最初の平行投影20は変
換される署名のイメージの第1の境界を定義する。この
境界21は太線部分で示される。最初の投影20により生成
された影22がハッチングで表示される。影は、原始イメ
ージの、境界21に属しない部分をカバーする。
【0024】同様に、2番目の投影23が実行される。図
3に示す例で、投影23はイメージの下から来る平行投影
でもある。よって、太線部分で示された、原始イメージ
の第2の境界24が生成される。図3で、平行投影23によ
り、ハッチングで示された影25が生成される。
【0025】続いて、投影20及び投影23の結果が組合わ
される。図4はこの組合せの結果を示す。その結果生成
された影26が図4のハッチングで示される。影26は影22
及び影25よりも小さい領域を占有する。影22及び影25の
重複する領域だけが影26の形成に寄与する。図4は本発
明により変換されたイメージを示す。このイメージは境
界21及び境界24並びに影26により形成される。
【0026】図5は、図4に示された変換から更に変換
された例を示す。枠 I.1、II.1及びIII.1 で、一個人の
3つの異なる署名のイメージが示されている。枠 I.2、
II.2及びIII.2 は本発明による変換の結果を示し、図4
に示された投影20及び23と同じ種類のものが図5に示さ
れた例で用いられる。
【0027】図6〜8は更に本発明の方法の例を示す。
この場合、図6に示す左からの投影30及び図7に示す右
からの投影31により変換が実行される。投影30及び投影
31により定義されたそれぞれの境界が再び図2〜5と類
似の太線部分で示される。図8には、投影30及び31によ
り実行された変換の結果が示される。この場合も、変換
されたイメージは、投影30及び31で生成された境界と投
影30及び31で生成された影34とにより定義される。影34
は影32及び33の重ね合わせにより定義される。影32及び
33の重なり合う領域たけが影34の生成に寄与する。これ
も図2〜5に示された例に類似している。
【0028】図9は4つの投影20、23、30及び31の変換
結果を示す。変換されたイメージは投影の各々により生
成された境界及びそれによって生じた影40により再定義
される。図2〜5及び図6〜8に示された例と同様に、
影40は影22、25、32及び33の重ね合わせ、即ち、影26及
び34の重ね合わせにより定義される。
【0029】図10〜13は本発明の方法による原始イ
メージの変換の別の例を示す。図10は2つの平行する
投影50及び51による変換の結果を示す。この場合、投影
は垂直方向から傾斜している。この例では、垂直に対す
る傾斜角はおよそ30゜である。同じ方法が図11に示さ
れた投影52及び53により実行された変換に当てはまる。
図12は図10及び11の変換の重ね合わせによる再定
義の結果生じた変換イメージを示す。
【0030】図13及び14を参照して、本発明により
影の内部構造を分析する方法について以下に説明する。
この方法の出発点は本発明により変換されるイメージで
ある。例えば、図4に示された変換されたイメージが再
び考慮される。図4に示された影26の内部構造を分析す
るために、投影20又は23の一方が再び実行される。図1
3に示された例では、投影23が再び実行されるが、境界
24は無視される。従って、影26の部分が削除され且つ投
影23により新たな境界60が定義される。再度の投影23に
よって削除される影26の一部分に第1の識別子 "1"が割
当てられる。この識別子は対応する削除部分の複雑さを
示す。
【0031】この手順は繰返して実行される。次の繰返
しは図14に示される。図13の手順に類似して、更に
投影23が実行されると同時に、前に投影23により定義さ
れた境界、即ち境界24及び60が無視される。それによっ
て、影26から更に一部分が削除される。これらの部分は
それに識別子が割当てられる。これもこの繰返しで削除
された領域の複雑さを示す。この例では、複雑さを示す
識別子は繰返し毎に1だけ増分されるので、図14に示
された例では、この繰返しで削除される影26の領域には
"2"が割当てられる。これも図14に示されている。
【0032】より一般的な場合には、この方法は下記の
ステップにより実行される。 (1) 原始イメージの変換のために実行された投影のうち
の1つを選択する。 (2) この投影を再実行し、原始イメージの変換のために
ステップ1で選択された投影により定義された境界を無
視することにより、イメージの新たな境界を定義する。 (3) この投影を再実行し、ステップ2で定義された新た
な境界も無視することにより、イメージの更に新たな境
界を定義する。 (4) 終了条件が満たされるまで、ステップ3を繰返す。
ステップ3の繰返しで、更に新たな境界が新たな境界の
役割を果たす。
【0033】ステップ(1) で選択された投影の実行によ
り削除される、変換されたイメージの原始の影の部分に
識別子が割当てられる。この投影のi番目の繰返しで削
除される原始の影の部分に識別子 "i"が割当てられる。
【0034】影の内部構造を分析する代替方法を図15
〜17に関連して以下に説明する。図15〜17の原始
イメージは螺旋形の線である。平行投影71は境界72を定
義するが、投影70は境界73を定義する。これらの2つの
投影の結果生じた影は図15におけるハッチングで示さ
れる。図15に示された影の縁の部分74は前記境界72又
は73の1つにより制限されない。
【0035】この方法の次のステップで、新たな投影75
が実行されるので、この新たな投影は影の縁の部分74に
直角な基準線を有する。図16でハッチングにより示さ
れている影の縁の部分76は投影70、71及び75により定義
された境界の1つにより制限されない。
【0036】本発明の方法の次のステップで、新たな投
影77が実行され、その結果生じる影の縁の前記部分76に
ほぼ直角な基準線を有する。これは、図17に示すよう
に、数回繰返される。繰返しが行われる毎に原始の影に
より占有された領域を次第に減少させる。後に続くステ
ップで削除される原始の影の部分の各々に、前記部分の
複雑さを表わす識別子が割当てられる。投影75により削
除される影の部分に識別子 "1"が割当てられ、投影77に
より削除される影の部分に識別子 "2"が割当てられ、そ
して投影78により削除される影の部分に識別子 "3"が割
当てられる。全ての新たな投影により影の一定の部分が
削除され、その部分に特定の識別子が割当てられ、この
例では新たな投影毎に識別子の参照番号が増分する。
【0037】境界により制限されない影の、2つ以上の
縁の部分がある場合、これらの部分の各々について専用
の投影が実行される。
【0038】このような部分が存在しない場合、変換さ
れたイメージ内に幾つかの境界により完全に限界を画さ
れる領域がある。影の縁の任意の小さな部分がもはや前
記境界により制限されないようにこの限界が開放され
る。以下、図15〜17に関連して記述された方法は終
了条件が満たされるまで同じように実行される。
【0039】終了条件を定める幾つかの可能性がある。
終了条件は最大数の反復又は残りの影の最小のサイズ又
は1つの反復から次の反復までの残りの影のサイズの最
小の変化として定義されることが望ましい。もう1つの
可能な終了条件は図13及び14並びに図15〜17を
参照して記述されている方法の実行に必要な最大計算時
間である。
【0040】本発明のもう1つの良好な実施例により、
本発明の方法はEP-A-0,483,391で開示された個人の署名
を自動的に検査する方法の改良に用いられる。本明細書
はコンピュータシステムによる個人の署名を自動的に検
査する、下記のステップを含む方法を開示する。 (a) 多数の画素を有する検査すべき前記署名のディジタ
ル化イメージを確立する。 (b) 検査すべきパラメータ値を前記ディジタル化イメー
ジから計算する。 (c) 検査すべき前記パラメータ値と対応する基準パラメ
ータ値を比較する。 (d) 検査すべき前記パラメータ値と前記基準パラメータ
値の差により、前記個人の前記署名の真偽を判定する。
【0041】本発明の開示により、基準署名分析モード
では、基準パラメータ値のセットを記憶するために個人
の少なくとも1つの異なる署名が処理される。このモー
ドは今後の検査の基礎を与える。
【0042】署名検査モードでは、検査すべきパラメー
タ値のセットの生成のために個人の1つの現在の署名が
処理される。記憶された基準パラメータ値のセット及び
検査すべき対応するパラメータ値のセットにより、現在
の署名が対応する基準署名に関しての真偽が、換言すれ
ば現在の署名をした個人が基準署名をした個人と同一人
であるかどうかが、判定される。前述のステップ (a)で
確立されたディジタル化イメージが本発明の方法により
変換される場合、EP-A-0,483,391に提案された方法が改
良される。その結果、検査すべきパラメータ値は、原始
のディジタル化イメージからではなく、変換されたイメ
ージから計算される。
【0043】同じ方法が基準署名分析モードで生成され
る基準パラメータ値の計算に当てはまる。基準パラメー
タは、ディジタル化イメージから直接には得られず、本
発明により変換されるディジタル化イメージから得られ
る。
【0044】図13及び14並びに図15〜17の本発
明の良好な実施例により削除される影の部分に割当てら
れる識別子は検査すべきパラメータ値として良好に用い
られる。
【0045】よって、EP-A-0,483,391の開示は全体とし
て明白に本明細書に適用される。本発明の別の良好な実
施例により、イメージを変換する本発明の方法がテキス
ト分割に用いられる。第1に、分割すべきテキストのイ
メージが本発明の方法により変換される。第2に、変換
されたイメージ内のギャップが検出される。このような
ギャップの例は図4に矢印27で示される。よって、ワー
ド "Ludwig" の2つのセグメント: "Lud" 及び "wig"が
定義される。
【0046】分割されるテキストが、イタリックで印字
されたテキストのように、一定の傾斜を有する場合、テ
キストの傾斜にほぼ平行の基準線を有する少なくとも1
つの投影を用いることが有利である。
【0047】前述のテキスト分割の方法は、前述の改良
された方法のステップ (b)でパラメータ値の計算にも用
いられる。見つかったセグメントの数及び(又は)位置
はパラメータ値として役立つ。
【0048】前述の方法の各々はコンピュータシステム
により自動的に実行される。例えば、図4の変換された
イメージは下記の手順に従ってコンピュータシステムに
より計算されることが望ましい。 (a) 0よりも大きいカラー密度を有する画素が発見され
る上から下への最初の投影の方向、この場合は垂直方向
で第1の事象を探索する。 (b) 画素のカラー密度が0よりも大きい下から上への2
番目の投影の方向、この場合は垂直方向で第1の事象を
探索する。 (c) これを水平方向の全ての座標について反復する。
【0049】投影の方向で前記手順により発見された画
素及びこれらの画素の間の画素により、変換されたイメ
ージが定義される。ステップ (a)及び (b)で発見された
画素の間にあるこれらの画素は、変換されたイメージの
影26を構成する。
【0050】本発明の方法で他のタイプの投影が用いら
れる場合、同様の手順が用いられる。例は点源による投
影又は他のタイプの対平行の投影である。
【0051】本発明による方法はコンピュータシステ
ム、自動現金支払器、自動テラー装置、スキャナー又は
キーボードレス入力コンピュータシステムのような装置
で用いられることが望ましい。
【0052】
【発明の効果】本発明によれば自動的な分類又はパター
ン認識のためにイメージを変換する改良された方法が提
供される。
【図面の簡単な説明】
【図1】原始署名を示す図である。
【図2】本発明に従って上と下からの投影による変換の
第1の例を示す図である。
【図3】本発明に従って上と下からの投影による変換の
第1の例を示す図である。
【図4】本発明に従って上と下からの投影による変換の
第1の例を示す図である。
【図5】本発明に従って上と下からの投影による変換の
第1の例を示す図である。
【図6】本発明に従って左と右からの投影による変換の
第2の例を示す図である。
【図7】本発明に従って左と右からの投影による変換の
第2の例を示す図である。
【図8】本発明に従って左と右からの投影による変換の
第2の例を示す図である。
【図9】本発明に従って上、下、左及び右からの投影に
よる変換の第3の例を示す図である。
【図10】本発明に従って傾斜した投影による変換の第
4の例を示す図である。
【図11】本発明に従って傾斜した投影による変換の第
4の例を示す図である。
【図12】本発明に従って傾斜した投影による変換の第
4の例を示す図である。
【図13】本発明の第1の方法による影の内部構造の分
析の例を示す図である。
【図14】本発明の第1の方法による影の内部構造の分
析の例を示す図である。
【図15】本発明の第2の方法による影の内部構造の分
析の例を示す図である。
【図16】本発明の第2の方法による影の内部構造の分
析の例を示す図である。
【図17】本発明の第2の方法による影の内部構造の分
析の例を示す図である。
【符号の説明】
20 投影 21 境界 22 影 23 投影 24 境界 25 影 26 影 27 矢印 30 投影 31 投影 32 影 33 影 34 影 40 影 50 投影 51 投影 52 投影 53 投影 60 境界 70 投影 71 投影 72 境界 73 境界 74 縁の部分 75 投影 76 縁の部分 77 投影 78 投影
フロントページの続き (72)発明者 フォルカー・ルドルフ ドイツ国、ザンクト・メルゲン 7811、ラ ンクホフストル 6番地

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】コンピュータによるパターン認識のために
    イメージを変換する方法であって、 最初の投影により前記イメージの第1の境界を定義する
    ステップと、 前記最初の投影と異なる2番目の投影により前記イメー
    ジの第2の境界を定義するステップと前記境界及び前記
    投影の結果生じる影により、変換されたイメージを定義
    するステップと、 よりなる方法。
  2. 【請求項2】前記イメージの更に他の境界を更に他の投
    影により定義する、請求項1の方法。
  3. 【請求項3】前記各投影が平行の投影又は点源による投
    影である、請求項1又は2の方法。
  4. 【請求項4】前記投影の基準線が互いに垂直又は対平行
    であるか又は前記投影が垂直に関して傾斜している請求
    項1乃至3の方法。
  5. 【請求項5】(a) 前記境界の1つを無視すべく前記投影
    の少なくとも1つを再び実行するステップと、(b) 終了
    条件を満たすまで上記ステップ (a)を反復して実行する
    ステップと、を更に含む、請求項1乃至4のいずれかの
    方法。
  6. 【請求項6】(a) 少なくとも1つの前記影の縁のうち前
    記境界の1つにより制限されない部分を探索するステッ
    プと、(b) 前記縁の前記部分にほぼ直角な基準線を有す
    る投影により前記影の少なくとも一部分を削除するステ
    ップと、(c) 終了条件を満たすまで上記ステップ (a)及
    び (b)を反復して実行するステップと、 を更に含む、請求項1乃至5のいずれかの方法。
  7. 【請求項7】(a) 複数の前記境界により完全に限界を画
    されている前記変換されたイメージの領域を識別するス
    テップと、(b) 前記領域に含まれている影の部分がもは
    や前記境界の1つにより制限されないように前記限界を
    開放するステップと、(c) 前記縁の部分にほぼ垂直な基
    準線を有する投影により前記影の少なくとも一部分を削
    除するステップと、(d) 終了条件を満たすまで上記ステ
    ップ (a)、(b)及び(c)を反復して実行するステップと、 を更に含む、請求項1乃至6のいずれかの方法。
  8. 【請求項8】前記終了条件は最大の反復数、残りの影の
    最小のサイズ、1つの反復から次の反復までの残りの影
    のサイズの最小の変化又は最大計算時間であり、又は前
    記終了条件は影が残っていない場合に満たされる、請求
    項5、6又は7の方法。
  9. 【請求項9】(a) 請求項5のステップ (a)、請求項6の
    ステップ (b)又は請求項7のステップ(c)で実行された
    投影により削除される前記影の当該部分に最初の識別子
    を割当てるステップと、(b) 請求項5のステップ (b)、
    請求項6のステップ (c)又は請求項7のステップ(d)で
    i番目に実行されたi番目の投影により削除される前記
    影の当該部分にi番目の識別子を割当てるステップと、 を更に含む、請求項5乃至8のいずれかの方法。
  10. 【請求項10】手書きもしくは印刷されたテキストまた
    は個人の署名を含むイメージをコンピュータで認識する
    方法であって、 請求項1乃至9のいずれかの方法により前記イメージを
    変換するステップと、 前記変換に基づいてパラメータ値を計算するステップ
    と、 よりなる方法。
  11. 【請求項11】テキスト分割の方法であって、(a) 請求
    項1乃至9のいずれかの方法により前記テキストのディ
    ジタル化イメージを変換するステップと、(b) 前記変換
    されたイメージ内のギャップを検出するステップと、
    (c) 前記ギャップが各セグメントの境界を定めるように
    前記テキストをテキストセグメントに分割するステップ
    と、 よりなる方法。
  12. 【請求項12】前記テキストがイタリックで印刷される
    ように前記投影の1つは分割すべきテキストの傾斜にほ
    ぼ平行である基準線を有する、請求項11の方法。
  13. 【請求項13】請求項1乃至12のいずれかによる方法
    を実行するようにプログラムされたコンピュータシステ
    ム。
  14. 【請求項14】パターン認識のためにイメージを変換す
    る装置であって、(a) 最初の投影により前記イメージの
    第1の境界を定義する手段と、(b) 前記第1の投影と異
    なる第2の投影により前記イメージの第2の境界を定義
    する手段と(c) 変換されたイメージを前記境界及び前記
    投影の結果生じた影により定義する手段と、 よりなる装置。
JP6007388A 1993-02-03 1994-01-27 コンピュータによるパターン認識のためのイメージ変換方法及び装置 Pending JPH06301781A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP93101621A EP0609474A1 (en) 1993-02-03 1993-02-03 Method and apparatus for transforming an image for classification or pattern recognition
EP93101621.6 1993-02-03

Publications (1)

Publication Number Publication Date
JPH06301781A true JPH06301781A (ja) 1994-10-28

Family

ID=8212575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6007388A Pending JPH06301781A (ja) 1993-02-03 1994-01-27 コンピュータによるパターン認識のためのイメージ変換方法及び装置

Country Status (3)

Country Link
US (1) US6246793B1 (ja)
EP (1) EP0609474A1 (ja)
JP (1) JPH06301781A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6885115B2 (en) 2001-03-14 2005-04-26 International Business Machines Corporation System, method and apparatus for controllable power supply
JP2012234512A (ja) * 2011-05-06 2012-11-29 King Abdulaziz City For Science & Technology (Kacst) テキストセグメンテーションのための方法、コンピュータプログラム製品およびシステム

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100416038B1 (ko) * 2000-06-27 2004-01-31 (주)패스싸인 다이나믹 프로그램과 뉴럴 네트워크를 이용한 전자서명인증방법
US6792133B2 (en) * 2001-04-10 2004-09-14 Picture Elements Incorporated Automatic bitonal image optimization
KR100453687B1 (ko) * 2002-07-13 2004-10-20 한국전자통신연구원 극점간의 매핑을 이용한 온라인 서명인증장치 및 그 방법
US7117453B2 (en) * 2003-01-21 2006-10-03 Microsoft Corporation Media frame object visualization system
US7509321B2 (en) * 2003-01-21 2009-03-24 Microsoft Corporation Selection bins for browsing, annotating, sorting, clustering, and filtering media objects
US7383497B2 (en) 2003-01-21 2008-06-03 Microsoft Corporation Random access editing of media
US7904797B2 (en) * 2003-01-21 2011-03-08 Microsoft Corporation Rapid media group annotation
US7120619B2 (en) 2003-04-22 2006-10-10 Microsoft Corporation Relationship view
US7620244B1 (en) 2004-01-06 2009-11-17 Motion Computing, Inc. Methods and systems for slant compensation in handwriting and signature recognition
JP2005311627A (ja) * 2004-04-20 2005-11-04 Matsushita Electric Ind Co Ltd 画像形成装置
US9424563B2 (en) * 2005-03-11 2016-08-23 Microsoft Technology Licensing, Llc Accessing medial context information using contextual links
US7613341B1 (en) * 2005-04-19 2009-11-03 Adobe Systems Incorporated Gap detection in a drawing
US7787711B2 (en) * 2006-03-09 2010-08-31 Illinois Institute Of Technology Image-based indexing and classification in image databases
US8088723B2 (en) * 2008-10-30 2012-01-03 The Clorox Company Polyaluminum compositions
KR101643612B1 (ko) * 2010-01-29 2016-07-29 삼성전자주식회사 촬영 방법 및 장치와 그 기록 매체
US8542889B2 (en) * 2010-10-19 2013-09-24 Apple Inc. Systems, methods, and computer-readable media for capturing a signature for use in a document

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5464431A (en) * 1977-10-31 1979-05-24 Fujitsu Ltd Edge detection system
JPS57113185A (en) * 1980-12-29 1982-07-14 Comput Basic Mach Technol Res Assoc Character recognition system
JPS615383A (ja) * 1984-06-19 1986-01-11 Fujitsu Ltd 文字パタ−ン分離装置
JPH03156589A (ja) * 1989-08-23 1991-07-04 Fuji Facom Corp 誤読文字の検出,修正方法
JPH03225578A (ja) * 1990-01-31 1991-10-04 Toshiba Corp 文字の検切り方法
JPH0444187A (ja) * 1990-06-11 1992-02-13 Fuji Facom Corp 文字認識装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3582883A (en) * 1966-10-13 1971-06-01 Farrington Electronics Inc Reading apparatus
CH591726A5 (ja) * 1973-07-30 1977-09-30 Nederlanden Staat
FR2305802A1 (fr) * 1975-03-26 1976-10-22 Pollard Jean Procede pour rendre une ecriture lisible par une machine de reconnaissance de forme
JPS5242028A (en) * 1975-09-29 1977-04-01 Fujitsu Ltd Letter recognition system
US4028674A (en) * 1976-06-04 1977-06-07 Recognition Equipment Incorporated Automated signature verification system
GB1587613A (en) * 1976-11-04 1981-04-08 Norprint Ltd Character identification
US4286255A (en) * 1979-02-22 1981-08-25 Burroughs Corporation Signature verification method and apparatus
JPH01112388A (ja) * 1987-10-26 1989-05-01 Ricoh Co Ltd 文字認識処理方法
US5231695A (en) * 1990-08-29 1993-07-27 Xerox Corporation Generalized clipping in an extended frame buffer
US5267325A (en) * 1991-09-06 1993-11-30 Unisys Corporation Locating characters for character recognition
US5321770A (en) * 1991-11-19 1994-06-14 Xerox Corporation Method for determining boundaries of words in text

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5464431A (en) * 1977-10-31 1979-05-24 Fujitsu Ltd Edge detection system
JPS57113185A (en) * 1980-12-29 1982-07-14 Comput Basic Mach Technol Res Assoc Character recognition system
JPS615383A (ja) * 1984-06-19 1986-01-11 Fujitsu Ltd 文字パタ−ン分離装置
JPH03156589A (ja) * 1989-08-23 1991-07-04 Fuji Facom Corp 誤読文字の検出,修正方法
JPH03225578A (ja) * 1990-01-31 1991-10-04 Toshiba Corp 文字の検切り方法
JPH0444187A (ja) * 1990-06-11 1992-02-13 Fuji Facom Corp 文字認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6885115B2 (en) 2001-03-14 2005-04-26 International Business Machines Corporation System, method and apparatus for controllable power supply
JP2012234512A (ja) * 2011-05-06 2012-11-29 King Abdulaziz City For Science & Technology (Kacst) テキストセグメンテーションのための方法、コンピュータプログラム製品およびシステム

Also Published As

Publication number Publication date
US6246793B1 (en) 2001-06-12
EP0609474A1 (en) 1994-08-10

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
Kovalevsky Image pattern recognition
US5467411A (en) System with approximation mechanism for recognizing graphical elements in a drawing
KR100248917B1 (ko) 패턴인식장치및방법
JP4745758B2 (ja) テキストおよびグラフィクスの空間認識およびグループ化
JPH06301781A (ja) コンピュータによるパターン認識のためのイメージ変換方法及び装置
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US5796867A (en) Stroke-number-free and stroke-order-free on-line Chinese character recognition method
Stamatopoulos et al. Goal-oriented rectification of camera-based document images
US7742642B2 (en) System and method for automated reading of handwriting
US7120318B2 (en) Automatic document reading system for technical drawings
EP0539739A2 (en) Improving on-line handwriting recognition using a prototype confusability dialogue
US7729541B2 (en) Comparative and analytic apparatus method for converting two-dimensional bit map data into three-dimensional data
JPH08305803A (ja) 文字テンプレートセット学習マシン動作方法
US6711292B2 (en) Block selection of table features
JPH05282495A (ja) 比較方法
US8571264B2 (en) Method of using structural models for optical recognition
EP0701224B1 (en) Method for interpreting hand drawn diagrammatic user interface commands
Tardón et al. Optical music recognition for scores written in white mensural notation
JPH08235341A (ja) ドキュメントファイリング装置および方法
CN111612045B (zh) 一种获取目标检测数据集的通用方法
Ye et al. Grouping text lines in freeform handwritten notes
Rocha et al. A solution to the problem of touching and broken characters
JP2000187705A (ja) 文書読取装置および方法および記憶媒体
EP4086744B1 (en) Gesture stroke recognition in touch-based user interface input

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term