JP2000508446A

JP2000508446A - 文字列の識別方法

Info

Publication number: JP2000508446A
Application number: JP9535826A
Authority: JP
Inventors: ツェーザートルステン; グロガーヨアヒム; マンドラーエバーハルト; シュタムパフォルカー
Original assignee: Siemens AG
Current assignee: Siemens AG
Priority date: 1996-04-11
Filing date: 1997-04-03
Publication date: 2000-07-04
Also published as: DE19614285C2; EP0892965A1; US6453054B1; WO1997038393A1; DE19614285A1; DE59700560D1; EP0892965B1

Abstract

(57)【要約】手書きおよび／または連結した文字列、例えば郵便番号の識別方法が記載されている。この方法は、ラスタ画像を特徴ベクトルの一次元シーケンスに導入することによって、ＨＭＭ識別器を使用して文字列の識別を切れ目なしで行うことができる。特徴分割に対するとくに有利な実施例が記載されている。

Description

【発明の詳細な説明】文字列の識別方法本発明は、文字列の識別方法に関する。文字列の機械識別は重要であり、昔から郵便配送での郵便番号の自動識別に使用している。高い識別能力は、個別の文字が識別されるときに達成される（例えば［１］）。従って文字列の識別に対しては通常、文字列の光学的走査から得られた画像をセグメント化によって個別文字ごとに部分領域に分割する（例えば［２］、［３］、［４］）。これにより識別問題を個別文字の識別に帰する。このようなセグメント化はとりわけ手書き文字および／または連続した文字列の場合は困難であり、コストがかかる。手書き語の識別からすでに、セグメント化を省略して、識別を特徴ベクトルのシーケンスに基づいてＨＭＭ（Hidden Markov Model）識別器を使用して行うことがすでに公知である［６］。前記の特徴ベクトルは、文字画像からの細い切り出し部のそれぞれの特性を表す。このようなＨＭＭ識別器を使用するのに特に重要なことは、特徴ベクトルの特徴を抽出することである。ここで特徴を抽出するために、［７］では面倒な輪郭部分の投影技術を用いて、フレームの大きさが所定の大きさに固定されている場合に上側とした側の長さを形態差として検出する。本発明の課題は、ＨＭＭ識別器を文字列の識別に使用するのに有利な方法を提供することである。本発明は、請求項１に記載されている。従属請求項には本発明の有利な構成および改善実施例が記載されている。本発明は、手書き文字および／または連結した文字列、とりわけ手書き郵便番号の識別も可能にする。特徴ベクトルに対する特徴の抽出はとりわけ有利には文字列の特殊性を考慮する。本発明を以下、有利な実施例に基づき図面を参照して説明する。文字列の一部として文字２’が実線で、また連続文字のライン部分Ｆが示されている。理想的には実線はラスタ内に占有されたラスタ点（ピクセル）の連続によって、または少数のラスタ点によって多角形表示の支持点として与えられる。光学的走査の際に得られたラスタ画像から、公知の方法、例えばラスタ画像の輪郭表示［５］を介してライン表示、または理想的には細い多角形近似ラインを得る。光学的走査により得られるラスタ画像は通常は複数のピクセルを含む線幅を有する。ライン表示は同じピクセルライン幅のピクセル列の形態で行われる。このような骨格化のためには複数の方法が公知技術から公知である。さらにそれ自体公知のラスタ画像またはラスタ画像表示の前処理ステップ、例えば回転等のルーチンを行うこともできる。文字列のライン表示から次に、骨格ラインの垂直最小値および最大値に基づいて上側ラインと下側ラインが文字列画像の書体ラインとして推定される。垂直最小値および最大値の検出は有利には、ステップごとに水平にシフトされる窓によって行われる。この窓の窓幅は文字幅よりも大きく、例えば文字幅の約２倍である。これは、各窓位置ごとに垂直最大値と最小値を検出し、最大値と最小値に対する両方の値シーケンスから回帰分析によって上側ラインと下側ラインに対する各勾配を推定するためである。従って上側ラインと下側ラインは必ずしも平行ではない。中央ラインは上側ラインと下側ラインの真ん中のラインとすることも、または別の線形回帰法を用いて垂直最大値と最小値の値シーケンスの結合から推定することもできる。ここで水平は通常のように文字を書く方向であり、垂直は書く方向に対して直角になる。文字幅は有利にはそれ自体公知のように元のラスタ画像またはその輪郭表示から推定することができる。既知の予想文字数を有する文字列では、文字幅を単純に文字列長の端数として仮定することもできる。ライン表示された文字列の画像は次に水平に相互に重なった細いフレームRn-2 ,Rn-1,Rn,Rn+1...に分割される。フレーム幅ＲＷは単に例えば文字幅ＺＷの２５％−４０％、約１／３である。１つのフレームは３つすべてのスクリプトラインの上に延在しており、それ自体がさらにスクリプトラインの１つを含む３つの領域に分割されている。この領域は垂直方向に重なっている。上側ラインＯＬを含む上側領域ＢＯと、下側ラインを含む下側領域ＢＵ（図では両方とも点線で示されている）はそれぞれ垂直方向に中央ラインの反対側で包括されたスクリプトラインを越えている。これは識別のために場合によっては重要な弧をさらに検出するためである。フレームＢＯとＢＵがラインＯＬないしＵＬを越えて垂直に伸長することにより、広がった線の考慮範囲を調整することができる。中央ラインＭＬを含む中央領域ＢＭは後で説明するように有利には特徴検出を補充するために、中央ラインの上側と下側で２つの部分領域ＢＭＯとＢＭＵに分けられている。フレーム位置は図の下に配置されたスケールにマークされたようにそれぞれステップＳＷごとに水平に相互にずらされている。フレーム幅ＲＷに対して小さなステップ幅によって、隣接するフレームが水平方向に重なり合う。フレームの水平方向列は、ステップごとＳＷのフレームの水平方向シフトと同値である。各フレーム位置において、コンポーネントの特性を有する特徴ベクトルが形成される。このコンポーネントは、フレーム部分にある文字列のライン表示のライン部分を特徴付ける。ここで３つの領域ＢＯ，ＢＭ，ＢＵは別個に処理される。ライン部分の特徴的パラメータとしてライン部分の配向が利用される。ここで有利には、４つの量子化方向、すなわち水平、垂直、並びにその間にある、４５°左および右に傾いた２つの対角方向（スクリプト方向に対して０°、４５°、９０°、１３５°に相応する）がベクトル成分として設定される。従って各領域には４つのベクトル成分が配属される。有利にはそれぞれ２つの別のベクトル成分を、中央領域ＭＢを２つに分割することにより形成された部分領域ＢＭＯとＢＭＵに配属する。これら部分領域では対角ライン成分だけを検出すればよい。このことによって簡単かつ効果的に、個々のもっじの対称特性を利用することができる。これにより全体で１６ベクトル成分が得られ、これらのベクトル成分が１つのフレーム位置に対する特徴ベクトルＶを形成する。ベクトル成分を占有する値を量的に検出するために有利には、所定の方向におけるライン部分の発生をバイナリで検出するだけではなく、種々の方向ごとに部分を累積した長さ成分も検出する。ここではライン表示を順次連続するピクセル列の形態で行うのが適当である。なぜなら、それぞれ水平、垂直または対角に隣接するピクセルを直接、該当する方向に対する絶対値として計数することができるからである。多角形表示の場合は、２つの量子化された方向の間で配向されたライン部分を有利には成分としてこの２つの方向に数え入れる。このようにして検出され、累積された長さ成分はさらに領域の大きさに正規化することができる。水平方向に順次連続するフレーム位置ごとの特徴ベクトルシーケンスはベクトルシーケンスとしてＨＭＭ識別器に供給される。識別方法はとくに有利には手書きおよび／または連結した郵便番号の識別に使用することができる。本発明の方法は有利には、許容文字列の辞書の低減と関連して、個別文字識別器の先行使用により適用される。

【手続補正書】特許法第１８４条の８第１項【提出日】１９９８年３月５日（１９９８．３．５）【補正内容】請求の範囲１．文字列の識別方法であって、文字列のラスタ画像を形成し、文字列のライン表示をラスタ画像から導出し、スクリプトラインを推定し、ライン表示を水平方向に重なり合うフレームに分割し、該フレームを再び、垂直に重なり合う複数の領域に分割し、前記領域に延在するライン部分の特徴を特徴ベクトルのコンポーネントとして、当該領域に対して別個に各フレーム内で検出し、水平方向に順次連続するフレームの特徴ベクトルをＨＭＭ識別器にベクトルシーケンスとして供給する方法において、スクリプトラインとして、上側ライン、下側ラインおよび中央ラインをライン表示から推定し、ライン表示の垂直方向に重なり合う領域として、・上側スクリプトラインを含む領域、・下側スクリプトラインを含む領域、および・中央スクリプトラインを含む領域を選択し、隣接する領域を、中央スクリプトラインを含む領域に加えて、中央ラインの上側部分と中央ラインの下側分とに分割し、当該部分は垂直方向に重なり合い、当該部分において、この部分に延在するライン部分の対角特徴だけをそれぞれ検出する、ことを特徴とする方法。２．フレームの水平方向幅は個別文字の幅の２５％から４０％に選択する、請求項１記載の方法。３．上側ラインおよび下側ラインをライン表示の垂直最大値および最小値から回帰分析を用いて直線として検出する、請求項１または２記載の方法。４．特徴ベクトルのコンポーネントとして、量子化された種々のライン方向を個々の領域において用いる、請求項１から３までのいずれか１項記載の方法。５．量子化されたライン方向として、垂直、水平および対角のライン経過を用いる、請求項４記載の方法。６．個別文字の幅を文字列のラスタ画像から導出する、請求項１から５までのいずれか１項記載の方法。

───────────────────────────────────────────────────── フロントページの続き (72)発明者フォルカーシュタムパドイツ連邦共和国Ｄ―56567 ノイヴィートアウフデムアッカー１

Claims

【特許請求の範囲】１．文字列の識別方法において、文字列のラスタ画像を形成し、ラスタ画像から文字列のライン表示を導出し、文字列のライン表示に対して上側ライン、下側ラインおよび中央ラインをスクリプトラインとして推定し、ライン表示を水平方向に重なり合うフレームに分割し、該フレームをさらに、それぞれ１つのスクリプトラインを含む複数の領域に分割し、当該領域は垂直方向に重なり合い、各フレーム内で、前記領域に対して分離した、当該領域に延在するライン部分の特徴を当該フレームに対する特徴ベクトルのコンポーネントとして検出し、水平方向に順次連続するフレームの特徴ベクトルをベクトルシーケンスとしてＨＭＭ識別器に供給する、ことを特徴とする識別方法。２．フレームの水平方向幅は個別文字の幅の２５％から４０％の間に選択される、請求項１記載の方法。３．上側ラインおよび下側ラインを、ライン表示の垂直最大値および最小値から回帰分析を用いて直線として検出する、請求項１または２記載の方法。４．特徴ベクトルのコンポーネントとして、個々の領域における量子化された種々のライン方向を用いる、請求項１から３までのいずれか１項記載の方法。５．量子化されたライン方向として、垂直、水平および対角のライン経過を用いる、請求項４記載の方法。６．中央ラインを含む領域から、中央ラインの上側ないし下側にある２つの部分領域に対して付加的に別個の対角ライン方向を特徴ベクトルのコンポーネントとして用いる、請求項５記載の方法。７．個別文字の幅は文字列のラスタ画像から導出する、請求項１から６までのいずれか１項記載の方法。