JPH06282686A - 文字認識方法 - Google Patents
文字認識方法Info
- Publication number
- JPH06282686A JPH06282686A JP3035331A JP3533191A JPH06282686A JP H06282686 A JPH06282686 A JP H06282686A JP 3035331 A JP3035331 A JP 3035331A JP 3533191 A JP3533191 A JP 3533191A JP H06282686 A JPH06282686 A JP H06282686A
- Authority
- JP
- Japan
- Prior art keywords
- character
- pixel
- characters
- vector
- black
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/184—Extraction of features or characteristics of the image by analysing segments intersecting the pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
(57)【要約】
【目的】 この発明の目的は、1度に1つずつ黒画素に
対して、白または黒画素を用いて複数の方向の各々にお
いて画素から何が見出されるかを示すベクトルが与えら
れる書類上の個々の未知の文字を認識する方法を提供す
ることにある。 【構成】 上記ベクトルは大きな経験から生成されるテ
ーブルに比較され、未知文字上の画素からのベクトルば
その文字であるという文字の組の各々の文字に対する確
率を発生する。このプロセスは未知文字の他の黒画素に
対して反復されるので、各々の文字に対する各種画素に
係る確率は乗算されて未知文字に対する確率を生成す
る。認識前の文字の選択的スケルトンは、可変量よりむ
しろ、文字をストロークに対する唯1つの画素幅にする
ことにより認識を補助するものである。
対して、白または黒画素を用いて複数の方向の各々にお
いて画素から何が見出されるかを示すベクトルが与えら
れる書類上の個々の未知の文字を認識する方法を提供す
ることにある。 【構成】 上記ベクトルは大きな経験から生成されるテ
ーブルに比較され、未知文字上の画素からのベクトルば
その文字であるという文字の組の各々の文字に対する確
率を発生する。このプロセスは未知文字の他の黒画素に
対して反復されるので、各々の文字に対する各種画素に
係る確率は乗算されて未知文字に対する確率を生成す
る。認識前の文字の選択的スケルトンは、可変量よりむ
しろ、文字をストロークに対する唯1つの画素幅にする
ことにより認識を補助するものである。
Description
【0001】
【産業上の利用分野】本発明は書類上の文字を認識する
方法とシステムに係り、特に文字、特に手書きされた、
特に小切手またはその他の金融関係の書類上の文字を識
別する新規な方法とシステムに関するものである。
方法とシステムに係り、特に文字、特に手書きされた、
特に小切手またはその他の金融関係の書類上の文字を識
別する新規な方法とシステムに関するものである。
【0002】
【従来の技術】従来、書類上の文字を認識または識別す
る多くの方法が提案されている。
る多くの方法が提案されている。
【0003】これらのシステムでは、文字の特定の特徴
に対してテンプレートかテスト済みのキー領域を通常は
使用している。即ち、文字の組の各々の文字に対するテ
ンプレートまたはオーバレイは認識されるべき文字に対
して整合され、また文字は、これがオーバレイの予め設
定された公差内で整合した場合に認識される。
に対してテンプレートかテスト済みのキー領域を通常は
使用している。即ち、文字の組の各々の文字に対するテ
ンプレートまたはオーバレイは認識されるべき文字に対
して整合され、また文字は、これがオーバレイの予め設
定された公差内で整合した場合に認識される。
【0004】ディジタル処理の場合、文字認識のための
各種の手法が知られており、これには、前回の質問に対
する答えに基づいて次の質問を出し、次に最後に文字が
何であるかに関する結論に達するツリー論理または神経
回路網論理が使用される。
各種の手法が知られており、これには、前回の質問に対
する答えに基づいて次の質問を出し、次に最後に文字が
何であるかに関する結論に達するツリー論理または神経
回路網論理が使用される。
【0005】
【発明が解決しようとする課題】これらのシステムは一
般に、使用する記憶および処理が少ないという点で効果
があるが、これらシステムは文字の識別、特にフリーハ
ンド即ち無拘束で書かれた文字の識別には不適切なこと
が見出されている。
般に、使用する記憶および処理が少ないという点で効果
があるが、これらシステムは文字の識別、特にフリーハ
ンド即ち無拘束で書かれた文字の識別には不適切なこと
が見出されている。
【0006】従って、文字を識別する従来のシステムに
は望ましくない制限と欠点が存在する。これは、無拘束
のフィールドにおいて手書き文字の認識を行うときに特
に問題となる。
は望ましくない制限と欠点が存在する。これは、無拘束
のフィールドにおいて手書き文字の認識を行うときに特
に問題となる。
【0007】本発明は、文字を認識する方法とシステム
を提供することにより従来のシステムの制限と欠点を克
服するものである。
を提供することにより従来のシステムの制限と欠点を克
服するものである。
【0008】
【課題を解決するための手段】本発明は、ルックアップ
テーブルで使用される履歴確率を計算するテストまたは
トレーニングセットを使用する。要求される精度に従っ
て、このトレーニングセットは必要なものとして展開可
能である。
テーブルで使用される履歴確率を計算するテストまたは
トレーニングセットを使用する。要求される精度に従っ
て、このトレーニングセットは必要なものとして展開可
能である。
【0009】このシステムは更に、特定の認識された文
字を求める信頼レベルがプログラム内かオペレータ制御
のいずれかによりセットまたはリセットされる。即ち、
如何なる文字も不当には読み取られず、また読取りに対
する付加的な失敗が受容できうことが重要なシステムに
おいては、成功裡の認識に対するしきい値は非常に高く
設定される。不当な読取り(置換)に対するペナルティ
が重要ではない他のシステムにおいては、しきい値は、
パーセントを読み取る失敗が非常に低く保たれるように
非常に低く設定可能である。
字を求める信頼レベルがプログラム内かオペレータ制御
のいずれかによりセットまたはリセットされる。即ち、
如何なる文字も不当には読み取られず、また読取りに対
する付加的な失敗が受容できうことが重要なシステムに
おいては、成功裡の認識に対するしきい値は非常に高く
設定される。不当な読取り(置換)に対するペナルティ
が重要ではない他のシステムにおいては、しきい値は、
パーセントを読み取る失敗が非常に低く保たれるように
非常に低く設定可能である。
【0010】このシステムは更に、第1の選択と第2の
選択の間の確率の差が調整自在である点で柔軟である。
即ち、第2の選択が第1の選択と(予め設定された範囲
内で)殆ど同じのときは文字は誤った認識を回避するた
め読み取られないものとして排除可能である。
選択の間の確率の差が調整自在である点で柔軟である。
即ち、第2の選択が第1の選択と(予め設定された範囲
内で)殆ど同じのときは文字は誤った認識を回避するた
め読み取られないものとして排除可能である。
【0011】
【実施例】第1図はIBMのモデル3890イメージ・
プラス(商標)高性能処理システム(Image Pl
us High Performance Trans
action System)などの書類画像処理シス
テム11に含まれる画像捕捉システム10を示す図であ
る。通常、このようなシステムではトランスポート13
を使用し、書類が通過するときプログラム制御下で書類
から読み取られた情報内容に基づき、書類12を一枚ず
つ図示しない入力ホッパから複数の他の処理ステーショ
ンを逐次通し、最後に幾つかの出力ホッパまたはポケッ
トの1つに移動させるように構成されている。この書類
移送は高速で行われる(システムが分あたり2400枚
の書類を処理することを可能にするモデル3890XP
では秒あたり300インチ以上)。 収束用レンズ15
を有する光学システム14は拡張アレイ17を使用し、
書類の黒・白またはグレイ特性のいずれかに基づいて、
書類の各ライン16の電気的表示を捕捉するようにして
いる。システムの分解能は設計および構成要素による
が、例えば各々のインチは垂直および水平方向の各々で
240画素に分割される。
プラス(商標)高性能処理システム(Image Pl
us High Performance Trans
action System)などの書類画像処理シス
テム11に含まれる画像捕捉システム10を示す図であ
る。通常、このようなシステムではトランスポート13
を使用し、書類が通過するときプログラム制御下で書類
から読み取られた情報内容に基づき、書類12を一枚ず
つ図示しない入力ホッパから複数の他の処理ステーショ
ンを逐次通し、最後に幾つかの出力ホッパまたはポケッ
トの1つに移動させるように構成されている。この書類
移送は高速で行われる(システムが分あたり2400枚
の書類を処理することを可能にするモデル3890XP
では秒あたり300インチ以上)。 収束用レンズ15
を有する光学システム14は拡張アレイ17を使用し、
書類の黒・白またはグレイ特性のいずれかに基づいて、
書類の各ライン16の電気的表示を捕捉するようにして
いる。システムの分解能は設計および構成要素による
が、例えば各々のインチは垂直および水平方向の各々で
240画素に分割される。
【0012】拡張アレイ17は、Rectionなど各
種の製造業者から市販されており、一連の電荷結合素子
を備え、これらの電荷結合素子においては各々のセンサ
に入射した光により光量に比例した電気信号が発生され
る。各々の素子からの電気信号はライン18上をアナロ
グ・ディジタル変換器19に送られ、この変換器はしき
い値処理と共に各々の画素をディジタル表示に変換し、
これは次にメモリ20に記憶され、必要に応じて記憶お
よび/または他の処理に供される。画像捕捉および処理
システムの詳細は、ここで特に引用される米国特許第
4,888,812号明細書に示されている。
種の製造業者から市販されており、一連の電荷結合素子
を備え、これらの電荷結合素子においては各々のセンサ
に入射した光により光量に比例した電気信号が発生され
る。各々の素子からの電気信号はライン18上をアナロ
グ・ディジタル変換器19に送られ、この変換器はしき
い値処理と共に各々の画素をディジタル表示に変換し、
これは次にメモリ20に記憶され、必要に応じて記憶お
よび/または他の処理に供される。画像捕捉および処理
システムの詳細は、ここで特に引用される米国特許第
4,888,812号明細書に示されている。
【0013】書類12は印刷または手書きの多くの指標
を有する。他の書類ではタイプされた文字または機械印
刷文字を有する。この指標には、日付フィールド22,
受取人ライン24,金額フィールド26(殆どの場合が
ワードよりも数値からなるコーテシー金額フィールド」
と呼ばれることもある),ワードで表した金額を含むフ
ィールド28,署名30,およびMICRコードライン
32が含まれる。
を有する。他の書類ではタイプされた文字または機械印
刷文字を有する。この指標には、日付フィールド22,
受取人ライン24,金額フィールド26(殆どの場合が
ワードよりも数値からなるコーテシー金額フィールド」
と呼ばれることもある),ワードで表した金額を含むフ
ィールド28,署名30,およびMICRコードライン
32が含まれる。
【0014】図2は拡大された図1の書類12からの金
額フィールド26を示す図である。この金額フィールド
26には、参照番号30により示された「$」および内
部に金額フィールドを有するボックス32が含まれる。
参照番号34により示される点線は金額フィールドが如
何にセグメント化されるかを示すものである。このセグ
メント化は幾つかの公知の方法の1つにより実現される
が、それらの1つは同時に出願される特許出願「書類上
の金額フィールドにおける文字画像をセグメント化する
方法」(以下、セグメント化特許という)に示されてい
る。
額フィールド26を示す図である。この金額フィールド
26には、参照番号30により示された「$」および内
部に金額フィールドを有するボックス32が含まれる。
参照番号34により示される点線は金額フィールドが如
何にセグメント化されるかを示すものである。このセグ
メント化は幾つかの公知の方法の1つにより実現される
が、それらの1つは同時に出願される特許出願「書類上
の金額フィールドにおける文字画像をセグメント化する
方法」(以下、セグメント化特許という)に示されてい
る。
【0015】セグメント化の結果、各々の文字は別々に
識別され、可能な場合には、本発明の文字認識アルゴリ
ズムに供される。
識別され、可能な場合には、本発明の文字認識アルゴリ
ズムに供される。
【0016】この場合、参照番号36は、金額フィール
ドにおいて小数点の後で1の前に生じる0を示してい
る。図4,5および9に関連した後の説明で、認識プロ
セスにおけるこの文字の使用を説明する。
ドにおいて小数点の後で1の前に生じる0を示してい
る。図4,5および9に関連した後の説明で、認識プロ
セスにおけるこの文字の使用を説明する。
【0017】図3は本発明における論理または流れを示
す図である。ブロック50において、金額フィールドな
どのフィールドが識別され、必要ならば他の処理のため
に、小さいが別のフィールドにコピーされる。これは、
同時に出願される特許出願「書類上の金額フィールドの
位置を特定する方法」により都合よく実現される。次
に、ブロック52において、画像は、「$」,小数点,
または認識されるべきその他の個々の文字などの個々の
文字または認識されるべきその他の指標にセグメント化
される。これは、好適な実施例のセグメント化特許に示
されるようにまたは他の類似の処理システムにより実施
することができる。
す図である。ブロック50において、金額フィールドな
どのフィールドが識別され、必要ならば他の処理のため
に、小さいが別のフィールドにコピーされる。これは、
同時に出願される特許出願「書類上の金額フィールドの
位置を特定する方法」により都合よく実現される。次
に、ブロック52において、画像は、「$」,小数点,
または認識されるべきその他の個々の文字などの個々の
文字または認識されるべきその他の指標にセグメント化
される。これは、好適な実施例のセグメント化特許に示
されるようにまたは他の類似の処理システムにより実施
することができる。
【0018】次に、ブロック54において、画像は正規
化され、次に視野(view)パターンがブロック56
で計算される。これの全ては図6から図9に関連して、
特に図6に関連してより詳細に説明されるが、これらの
視野パターンはブロック54からの正規化された画像中
の黒画素の各々において視野パターンをとることを含ん
でいる。次に、ブロック58において視野パターンが使
用される。本発明はトレーニングセットを用いて発生さ
れるベクトルの各々に対する確率を計算することを期待
するので、トレーニングモードにおいてこれらの視野が
用いられルックアップテーブルを生成する。
化され、次に視野(view)パターンがブロック56
で計算される。これの全ては図6から図9に関連して、
特に図6に関連してより詳細に説明されるが、これらの
視野パターンはブロック54からの正規化された画像中
の黒画素の各々において視野パターンをとることを含ん
でいる。次に、ブロック58において視野パターンが使
用される。本発明はトレーニングセットを用いて発生さ
れるベクトルの各々に対する確率を計算することを期待
するので、トレーニングモードにおいてこれらの視野が
用いられルックアップテーブルを生成する。
【0019】本発明は正規化された画像、即ち、単一画
素幅のスケルトンまたはストローク幅に低減されたもの
に関連して説明されている。これがなされないときは、
次の黒画素がどこにあるかということだけでなく、黒セ
グメントがそこに如何に長くあるかを知ることが望まれ
る。これは、図7に、また図8および図9のベクトルに
対して1つ以上の付加的視野の記述が付加可能であるこ
とを示唆するものである。これは、幾つかの場合には、
認識の精度に付加され、更に要求される記憶および処理
能力にほぼ付加される。
素幅のスケルトンまたはストローク幅に低減されたもの
に関連して説明されている。これがなされないときは、
次の黒画素がどこにあるかということだけでなく、黒セ
グメントがそこに如何に長くあるかを知ることが望まれ
る。これは、図7に、また図8および図9のベクトルに
対して1つ以上の付加的視野の記述が付加可能であるこ
とを示唆するものである。これは、幾つかの場合には、
認識の精度に付加され、更に要求される記憶および処理
能力にほぼ付加される。
【0020】未知文字xの視野パターンは予め生成され
たテーブルに適用されて、所定のベクトル(図8)が文
字の組の各文字に関係するという確率を求めることにな
る。
たテーブルに適用されて、所定のベクトル(図8)が文
字の組の各文字に関係するという確率を求めることにな
る。
【0021】図4は図2における金額フィールドの文字
0を示す図である。図示のように、複数の行(R0〜R
25)と複数の列(列C0〜C22)とが、文字0を含
むものとして識別されている長方形アレイを構成してい
る。
0を示す図である。図示のように、複数の行(R0〜R
25)と複数の列(列C0〜C22)とが、文字0を含
むものとして識別されている長方形アレイを構成してい
る。
【0022】次に、この文字は正規化されて、行(R0
〜R9)および列(C0〜C7)を含む図5の画像を生
成する。
〜R9)および列(C0〜C7)を含む図5の画像を生
成する。
【0023】図6は、円で囲まれている中央画素60
と、8個の識別された周囲方向の各々に延びる8本の放
射ライン61〜68、即ち画素60から北(N)を見る
ライン61、北東(NE)を見るライン62、東(E)
を見るライン63、更に北西(NW)を見るライン68
までのラインを有する異なる文字(数字7)を示す図で
ある。全体の文字ボックスを通して上記ラインの各々に
沿って、黒画素がその経路内にあるか、もしあるならど
こにあるかということが問題である。
と、8個の識別された周囲方向の各々に延びる8本の放
射ライン61〜68、即ち画素60から北(N)を見る
ライン61、北東(NE)を見るライン62、東(E)
を見るライン63、更に北西(NW)を見るライン68
までのラインを有する異なる文字(数字7)を示す図で
ある。全体の文字ボックスを通して上記ラインの各々に
沿って、黒画素がその経路内にあるか、もしあるならど
こにあるかということが問題である。
【0024】図7に示したように、任意の特定の方向に
見る所与の画素からの視野記述はいずれもその経路に黒
画素を含まず(この場合、それには0の視野番号が割り
当てられる。)、その経路内の隣接画素は黒であるか
(その場合1の視野番号が割り当てられる)、または隣
接画素はその経路内の最終的に黒が続く白である(この
場合、2の視野番号が割り当てられる)。2の視野番号
は更に、対角線が単に1/2 離れた2つの黒の間を通
る場合にも割り当てられる。これらの視野番号および視
野記述は幾分任意に割り当てられ、また記述および番号
付けの他の方法を使用することもできる。
見る所与の画素からの視野記述はいずれもその経路に黒
画素を含まず(この場合、それには0の視野番号が割り
当てられる。)、その経路内の隣接画素は黒であるか
(その場合1の視野番号が割り当てられる)、または隣
接画素はその経路内の最終的に黒が続く白である(この
場合、2の視野番号が割り当てられる)。2の視野番号
は更に、対角線が単に1/2 離れた2つの黒の間を通
る場合にも割り当てられる。これらの視野番号および視
野記述は幾分任意に割り当てられ、また記述および番号
付けの他の方法を使用することもできる。
【0025】従って、図8において、図6の画素60に
対する視野パターンが識別されており、即ち、画素60
から北(N)を見るライン61に沿う方向で、隣接画素
は、後に黒画素が続く白であり、2の視野番号が割り当
てられる。ライン62に沿う北東(NE)方向では、隣
接画素は黒であり、北東方向の1の視野番号が割り当て
られる。ライン63に沿う東(E)方向では、画素60
から文字の東方向エッジへの黒画素は存在せず、従って
視野番号は0である。同様に、南東(SE)方向では、
ライン65に沿う南(S)方向の場合と同様に経路内に
は黒画素はやはり存在しない。画素60から南西(S
W)を見るライン66に沿い、隣接画素は黒であり、1
の視野番号が割り当てられる。画素60から西(W)の
方向では径路内には黒画素は存在せず、0の視野番号が
割り当てられ、またライン68に沿う北西(NW)方向
では黒画素が最後に続く隣接白画素が存在し、北西方向
に対して2の視野番号が割り当てられる。
対する視野パターンが識別されており、即ち、画素60
から北(N)を見るライン61に沿う方向で、隣接画素
は、後に黒画素が続く白であり、2の視野番号が割り当
てられる。ライン62に沿う北東(NE)方向では、隣
接画素は黒であり、北東方向の1の視野番号が割り当て
られる。ライン63に沿う東(E)方向では、画素60
から文字の東方向エッジへの黒画素は存在せず、従って
視野番号は0である。同様に、南東(SE)方向では、
ライン65に沿う南(S)方向の場合と同様に経路内に
は黒画素はやはり存在しない。画素60から南西(S
W)を見るライン66に沿い、隣接画素は黒であり、1
の視野番号が割り当てられる。画素60から西(W)の
方向では径路内には黒画素は存在せず、0の視野番号が
割り当てられ、またライン68に沿う北西(NW)方向
では黒画素が最後に続く隣接白画素が存在し、北西方向
に対して2の視野番号が割り当てられる。
【0026】図5のパターンにこの方法を適用すると、
図9に示したテーブルが生成される。このテーブルにお
いて、位置R1,C5に対応するライン1は、それぞれ
北(N),北東(NE),東(E),南東(SE),南
(S),南西(SW),西(W),および北西(NW)
の方向の「00122100」のベクトルを有してい
る。
図9に示したテーブルが生成される。このテーブルにお
いて、位置R1,C5に対応するライン1は、それぞれ
北(N),北東(NE),東(E),南東(SE),南
(S),南西(SW),西(W),および北西(NW)
の方向の「00122100」のベクトルを有してい
る。
【0027】ライン2はR1,C6に配置された次の黒
画素に対する類似の視野パターンである。これは各々の
黒画素に対して継続し、ここではそれらの幾つかのみが
リストされている。
画素に対する類似の視野パターンである。これは各々の
黒画素に対して継続し、ここではそれらの幾つかのみが
リストされている。
【0028】次に、ライン1に対して生成されたベクト
ルの各々に対して(例えば、ベクトル0012210
0)、このベクトルが許容された各々の文字状態に関わ
るという、ルックアップテーブルに確立され記憶されて
いる確率が存在する。設定された番号に対して、許容さ
れる文字状態は番号0〜9であるが、金額フィールド
は、$,小数点,および許容され認識が試みられる他の
記号などの他の文字を有する。
ルの各々に対して(例えば、ベクトル0012210
0)、このベクトルが許容された各々の文字状態に関わ
るという、ルックアップテーブルに確立され記憶されて
いる確率が存在する。設定された番号に対して、許容さ
れる文字状態は番号0〜9であるが、金額フィールド
は、$,小数点,および許容され認識が試みられる他の
記号などの他の文字を有する。
【0029】ライン1〜Nに対する確率の全てが決定さ
れた後、識別されるべき文字の確率は組内の第1の文字
であり、個々の確率の積であり、即ち、組内の第1文字
に対してそれはA1×B1×C1×D1×E1×〜×I
1になる。この文字が組内の第2文字である確率はA2
×B2×〜×I2になる。
れた後、識別されるべき文字の確率は組内の第1の文字
であり、個々の確率の積であり、即ち、組内の第1文字
に対してそれはA1×B1×C1×D1×E1×〜×I
1になる。この文字が組内の第2文字である確率はA2
×B2×〜×I2になる。
【0030】次に、これらの積は正規化され、また1要
素である未知文字の確率は、それが次の要素である確率
と比較可能である。このとき適切な認識アルゴリズムが
用いられて、成功裡に認識される文字を考慮するために
絶対値の確率が如何に高く要求されるか、第2に第1の
候補が、問題が生じる前に第2の候補よりどれ程大きく
なければならないかに関するしきい値限界を設定するこ
とができる。
素である未知文字の確率は、それが次の要素である確率
と比較可能である。このとき適切な認識アルゴリズムが
用いられて、成功裡に認識される文字を考慮するために
絶対値の確率が如何に高く要求されるか、第2に第1の
候補が、問題が生じる前に第2の候補よりどれ程大きく
なければならないかに関するしきい値限界を設定するこ
とができる。
【0031】本発明の精神から逸脱せずに本発明に対す
る多くの変形および適合が効果的になされ得ることは勿
論である。例えば、正規化が開示され、いくつかの場合
にはそれが望ましいが、他の場合には望ましくない。更
に、割り当てられた視野番号および方向の番号は任意で
あり、所望に応じて、また処理システムにより許容され
るように増加または減少されてよい。
る多くの変形および適合が効果的になされ得ることは勿
論である。例えば、正規化が開示され、いくつかの場合
にはそれが望ましいが、他の場合には望ましくない。更
に、割り当てられた視野番号および方向の番号は任意で
あり、所望に応じて、また処理システムにより許容され
るように増加または減少されてよい。
【0032】
【発明の効果】本発明は、認識される文字の大きさ、個
々の特徴が形成される筆致の方向に特に制限されないと
いう効果を有する。更に、本発明は、ストレイマーク、
筆記者の付加的なマークまたは背景ノイズのいずれか
が、認識プロセスに対して最小に作用するという効果を
有する。本発明には、単一画素のストローク幅へ多重画
素のストローク幅を初めに含む文字画像を正規化しスケ
ルトン化する、望ましいが任意の方法が含まれる。
々の特徴が形成される筆致の方向に特に制限されないと
いう効果を有する。更に、本発明は、ストレイマーク、
筆記者の付加的なマークまたは背景ノイズのいずれか
が、認識プロセスに対して最小に作用するという効果を
有する。本発明には、単一画素のストローク幅へ多重画
素のストローク幅を初めに含む文字画像を正規化しスケ
ルトン化する、望ましいが任意の方法が含まれる。
【図1】本発明に関わる画像書類処理システムを示す図
である。
である。
【図2】図1のサンプル小切手からの金額フィールドを
示す図である。
示す図である。
【図3】本発明の論理のための流れ図である。
【図4】図2の金額フィールドからの文字の画素要素の
マトリクスを示す図である。
マトリクスを示す図である。
【図5】図4の文字のスケルトン化され、正規化された
例を示す図である。
例を示す図である。
【図6】所与の画素から見られる多重方向ベクトルを展
開するのに有用な視野パターン認識システムを示す図で
ある。
開するのに有用な視野パターン認識システムを示す図で
ある。
【図7】特定の方向の特定の画素からの視野を記述する
と共にこの視野に対して視野番号を割り当てるテーブル
を示す図である。
と共にこの視野に対して視野番号を割り当てるテーブル
を示す図である。
【図8】図6の画素に対するサンプルベクトルを示す図
である。
である。
【図9】図5の文字に対する視野ベクトルおよび確率を
含むテーブルを示す図である。
含むテーブルを示す図である。
10 画像捕捉システム 11 書類画像処理システム 12 書類 13 トランスポート 14 光学システム 15 収束用レンズ 17 拡張アレイ 19 アナログ・ディジタル変換器 20 メモリ
Claims (4)
- 【請求項1】未知文字をそのディジタル画像から認識す
る方法であって、 前記未知文字の画像中の黒画素を識別するステップと、 画像中の様々な黒画素に対して、複数の方向の各々にお
ける次の黒画素の位置を識別するステップと、 識別された各々の方向における次の黒画素の位置に基づ
いて情報のベクトルを発生するステップと、 前記ベクトルを、このベクトルが文字の組の中の各文字
を識別する確率を示すテーブルと比較するステップと、 各々の画素ベクトルに対して文字の組の中の各文字の確
率を乗算し、前記未知文字を最高の確率値を生成する文
字として識別するステップとを含む文字認識方法。 - 【請求項2】画像中の黒画素を識別するステップの前
に、ストロークを可能な単一画素幅に低減するステップ
を更に含む請求項1記載の文字認識方法。 - 【請求項3】各々が隣接する方向から45度隔置された
8方向の各々に対してベクトルおよび確率を発生する請
求項1記載の文字認識方法。 - 【請求項4】前記次の黒画素の位置を識別するステップ
とベクトルを発生するステップは、画像中の各黒画素に
対して行われる請求項2記載の文字認識方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US491895 | 1990-03-12 | ||
US07/491,895 US5105470A (en) | 1990-03-12 | 1990-03-12 | Method and system for recognizing characters |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06282686A true JPH06282686A (ja) | 1994-10-07 |
JPH0792820B2 JPH0792820B2 (ja) | 1995-10-09 |
Family
ID=23954115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3035331A Expired - Lifetime JPH0792820B2 (ja) | 1990-03-12 | 1991-02-05 | 文字認識方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US5105470A (ja) |
EP (1) | EP0446632A3 (ja) |
JP (1) | JPH0792820B2 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5303311A (en) * | 1990-03-12 | 1994-04-12 | International Business Machines Corporation | Method and apparatus for recognizing characters |
US5428692A (en) * | 1991-11-18 | 1995-06-27 | Kuehl; Eberhard | Character recognition system |
US5481621A (en) * | 1992-05-28 | 1996-01-02 | Matsushita Electric Industrial Co., Ltd. | Device and method for recognizing an image based on a feature indicating a relative positional relationship between patterns |
CA2108536C (en) * | 1992-11-24 | 2000-04-04 | Oscar Ernesto Agazzi | Text recognition using two-dimensional stochastic models |
JPH07319924A (ja) * | 1994-05-24 | 1995-12-08 | Matsushita Electric Ind Co Ltd | 手書き電子文書のインデックス付けおよび探索方法 |
US5692069A (en) * | 1995-03-17 | 1997-11-25 | Eastman Kodak Company | Apparatus for performing character segmentation using slant histograms |
US6094506A (en) * | 1995-10-25 | 2000-07-25 | Microsoft Corporation | Automatic generation of probability tables for handwriting recognition systems |
US6731803B1 (en) | 1999-07-12 | 2004-05-04 | Advanced Recognition Technologies, Ltd | Points based handwriting recognition system |
US7010166B2 (en) * | 2000-11-22 | 2006-03-07 | Lockheed Martin Corporation | Character recognition system and method using spatial and structural feature extraction |
CA2375355A1 (en) * | 2002-03-11 | 2003-09-11 | Neo Systems Inc. | Character recognition system and method |
US7639259B2 (en) * | 2006-09-15 | 2009-12-29 | Seiko Epson Corporation | Method and apparatus for preserving font structure |
GB2452513A (en) * | 2007-09-05 | 2009-03-11 | Sony Corp | Image recognition including modifying width of image |
WO2015141260A1 (ja) * | 2014-03-17 | 2015-09-24 | 株式会社河合楽器製作所 | 手書き音楽記号認識装置およびプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2978675A (en) * | 1959-12-10 | 1961-04-04 | Bell Telephone Labor Inc | Character recognition system |
US4115760A (en) * | 1974-11-18 | 1978-09-19 | Fujitsu Limited | Figure pre-processing device |
US4177448A (en) * | 1978-06-26 | 1979-12-04 | International Business Machines Corporation | Character recognition system and method multi-bit curve vector processing |
JPS6279582A (ja) * | 1985-10-03 | 1987-04-11 | Ricoh Co Ltd | 文字認識用辞書作成方式 |
US4888812A (en) * | 1987-12-18 | 1989-12-19 | International Business Machines Corporation | Document image processing system |
-
1990
- 1990-03-12 US US07/491,895 patent/US5105470A/en not_active Expired - Fee Related
-
1991
- 1991-02-05 JP JP3035331A patent/JPH0792820B2/ja not_active Expired - Lifetime
- 1991-02-13 EP EP19910101999 patent/EP0446632A3/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
US5105470A (en) | 1992-04-14 |
EP0446632A2 (en) | 1991-09-18 |
EP0446632A3 (en) | 1993-03-24 |
JPH0792820B2 (ja) | 1995-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109740606B (zh) | 一种图像识别方法及装置 | |
Mohammad et al. | Optical character recognition implementation using pattern matching | |
US4837842A (en) | Character and pattern recognition machine and method | |
CA1160347A (en) | Method for recognizing a machine encoded character | |
US5504822A (en) | Character recognition system | |
Shinde et al. | Text pre-processing and text segmentation for OCR | |
RU2621601C1 (ru) | Устранение искривлений изображения документа | |
CN104346640A (zh) | 二维码及生成二维码的方法 | |
JPH06282686A (ja) | 文字認識方法 | |
Yadav et al. | A robust approach for offline English character recognition | |
CN108875727B (zh) | 图文标识的检测方法及装置、存储介质、处理器 | |
Den Hartog et al. | Knowledge-based interpretation of utility maps | |
US6240209B1 (en) | Method for deriving character features in a character recognition system | |
Han et al. | Off-line cursive handwriting segmentation | |
US6694059B1 (en) | Robustness enhancement and evaluation of image information extraction | |
CN113837129B (zh) | 手写签名错别字识别方法、装置、设备及存储介质 | |
Khuspe et al. | Robust image forgery localization and recognition in copy-move using bag of features and SVM | |
US5872730A (en) | Computerized correction of numeric data | |
JP2985893B2 (ja) | パターン認識装置 | |
Dayananda Kumar et al. | Automated parameter-less optical mark recognition | |
Gupta et al. | A Novel Automated Solver for Sudoku Images | |
Nikitin et al. | Research of recognition algorithm for sheet metal marking | |
Radhi | Text Recognition using Image Segmentation and Neural Network | |
Krisnadi et al. | A multiple-choice test recognition system based on android and RBFNN | |
CN113111833B (zh) | 人工智能系统的安全性检测方法、装置及终端设备 |