JPH05506114A - 機械印刷文字用光学的文字認識神経網システム - Google Patents

機械印刷文字用光学的文字認識神経網システム

Info

Publication number
JPH05506114A
JPH05506114A JP91504481A JP50448191A JPH05506114A JP H05506114 A JPH05506114 A JP H05506114A JP 91504481 A JP91504481 A JP 91504481A JP 50448191 A JP50448191 A JP 50448191A JP H05506114 A JPH05506114 A JP H05506114A
Authority
JP
Japan
Prior art keywords
character
neural network
image
block
character image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP91504481A
Other languages
English (en)
Inventor
ガボウスキ,ロジャー・スティーヴン
ビートゥ,ルイス・ジェームズ
バースキ,ロリ・リン
タン,ヒン―レオン
アッサド,アンドリュー・マサイアス
デュトン,ダウン・ローライン
Original Assignee
イーストマン・コダック・カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イーストマン・コダック・カンパニー filed Critical イーストマン・コダック・カンパニー
Publication of JPH05506114A publication Critical patent/JPH05506114A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 印 ・ 切−システム 発明の背景 技匝的分野 本発明は、複数のフォントの任意の1つにおける機械印刷された英数字文字を認 識するために神経網を用いる光学的文字認識システムの分野に関する。
背景技玉 光学的文字認識は、書類上の各文字が所定の英数字記号組における適当な記号と 正しく関連していることを必要とする。書類上の文字が特定の英数字記号として 認識されなければならないイメージパターンを構成するという意味でこれはパタ ーン認識に頚僚している。パターン認識システムは周知であり、例えば、米国特 許第3,192,505号、3,267.439号、3,275.985号、3 .275,986号、及び4,479,241号に開示されている。斯かるパタ ーン認識システムは、英数字文字を認識する上での固有の問題に対処するのに特 に好適ではない、これらの問題は以下に論じられよう。
関連技術は、1988年6月発行のカラディルによる「神経網プライマJAIエ キスパートの53頁乃至59頁に且つルメルハート他による並列lid処理の第 −巻の318頁乃至330頁に記載されている神経網である。神経網を用いて数 (英数字文字)を認識することは、ジョーシア州アトランタでの1986年のシ ステム、人間及び人工頭脳学に関するIEEE国際会議の会報の1621頁乃至 】625頁(1986年8月)のバーによる「神経網数字認識装置」によって提 案された。神経網を用いて英数字文字を認識することは、神経網に関する国際合 同会議の会報の第二巻の606頁乃至614頁(1989年6月18日−22日 )の会報のハヤシ他による「ポケットアルゴリズムを有する結合モデルを用いる 英数字文字認識」によって提案されている。ハヤシ他の発表は、度数分布図を用 いて書類上の各文字イメージを分割又は分離し且つ次にこれを神経網に伝送する 前に各文字イメージを標準寸法に正常化する光学的文字認識システムを開示して いる。更に、ハヤシ他の発表は、同一のシステムを用いて2つ以上の種類のフォ ントを認識できることを開示している。しかしながら、上記の特許及び発表のど れも、神経網が曖昧な即ち信頼できない記号選択を行なった時に、即ち、その[ 点Jが第二及び第三選択にかなり近い選択を行なった時に何をすべきかという問 題を扱っていない、更に、これらはどれも、隣接文字によって飾りつけられた文 字をこれらが度数分布的分割技術によって分離しないように認識する方法の問題 を扱っていない。最後に、上記の特許及び発表のどれも、隣接文字に接触してい る文字の認識方法の問題について扱っていない。
によ て”れる量 神経網が文字イメージを認識してこの文字イメージをこのイメージが表わす記号 と正しく関係づけることができる前に、文字イメージは書類上の他の文字のイメ ージから分離されていなければならず且つその寸法はこの神経網が処理するよう に訓練されている文字イメージ寸法及びアスペクト比に正常化−一致−していな ければならない。隣接している文字イメージを互いに分離することは通常、連続 した「オン」画素からなる2つの領域の間に存在している「オン」画素が欠けて いる行又は列を単純に見つけることからなる分割プロセスによって達成される。
この分割プロセスは単に、これら2つの領域が「オン」画素が欠けていると見い だされた行又は列によって分離された異なった文字イメージであると宣言する。
斯かる分割技術はしばしば「ヒストグラミングjと呼ばれる。
斯かる分割技術にかかる1つの問題は、これらが飾りつけられた隣接文字を分離 できないことである。飾りつけられた文字というのは、必ずしも接触しておらず 、それらの一方が他方を囲んでいる隣接した文字である。例えば、特定のフォン トにおいて、第1図に示すように、大文字「P」は次の小文字「e」を囲んでい る。これら2つの文字は本当は書類イメージにおいて互いに分離されているが、 第1a図から判るように、これら2つの文字の間にはrオンノ画素が欠けている 行又は列が存在していない。斯くして、上で論じられた分割技術はこれら2つの 文字を分離することができない、その結果、神経網はどちらの文字も認識するこ とができない。
上で論じられた分割技術に斯かる別の問題は、これらが実際的に接触又は連結し ている隣接文字を分離することができないことである0例えば、第1b図に示す ように、その底部が次の大文字rl、と併合している大文字「L」は大文字「U 」のように見え得る。第1a図の例のように、第1b図は、「オンJ画素が欠け ている行又は列が存在せず、従ってこの分割技術はこれら2つの連結した文字を 分離することができず且つ神経網はこれらの文字のどれも認識することができな いことを示している。
神経網を用いて光学的文字認識を達成することに斯かる関連の問題は、神経網が 与えられた文字イメージに対して一義的な記号選択を行うことができないことで ある。斯かる事象は、上記のように、飾りっけ又は接触している文字によって生 しるかあるいは悪い書類イメージの品質等の他のことによって生じ得る。周知の ように、この神経網はその記号出力の1つにおいて非常に高い得点を且つその他 の記号出力の全てにおいて非常に低い得点を発生することにより一義的な選択を 行う。神経網が一義的記号選択を行うことができない時に必ず、その記号出方の どれも比較的高い得点を有しておらず、実際その記号出力の幾つかは同様の得点 を有し得る。この問題は、特に、特定の文字イメージが神経網に認識可能でない という理由が前もって知られていない場合に、神経網が認識することができない 文字イメージを如何に処理するかということである。
更に別の問題は、神経網による処理に適切な寸法に正常化されると、同様の形の 英数字記号から実用的に区別不可能な非常に小さな記号(コンマ、引用符等)を 含む記号組が選択され得ることである9通常、神経網は、特定の寸法及びアスペ クト比の文字イメージを認識するように訓練されている。書類が印刷された時に 用いられるフォントに応じであるいは書類が拡大又は縮小を表わすかに応じて、 書類からとられた各文字イメージは、神経網によって処理される前に正常化され て、これによりその寸法及びアスペクト比が神経網が認識するように訓練された 文字イメージ寸法及びアスペクト比に一致するようにしなければならない。例え ば、文字イメージ寸法は2進方画素の12行×24列であり得る。
更に別の目的は、特定の記号(例えば、c、p、 w、s、 χ等)のケース( 大文字又は小文字)が記号の寸法によってのみ決定され、従って文字正常化の後 は区別することができないことである。斯くして、神経網によるそれらの認識に 続く斯かる記号のケースを直すために何らかの対策がなされなければならない。
従って、本発明の1つの目的は、神経網が一義的記号選択を行うことができない 時は必ず文字を認識することにある。
本発明の別の目的は、神経網が信頼できる選択を行うことができない時はいつで も検知し、次に飾り付けられた隣接文字が存在するか否かを識別することにある 。
本発明の更に別の目的は、神経網が信頼できる選択を行うことができない時は必 ず検知し且つ次に飾り付けられた隣接文字が存在するか否かあるいは接触してい る隣接文字が存在するか否かを識別することにある。
本発明の更に別の目的は、文字正常化に続く他の記号から区別することができな い特別な記号を認識し且つ適切なケース(大文字あるいは小文字)を神経網によ って信顛的に認識されるがそのケースが文字正常化の後区別することができない 記号に割り当てることにある。
本発明の更に別の目的は、最も複雑化されていないタスクが先に達成され且つよ り複雑化されているタスクがそれらの特定の文字イメージの必要性の決定の後に のみ達成されるという順序で前記の目的の各々を達成することにある。
発明の開示 本発明は、所定の記号組を認識するように訓練された神経網、この神経網による 1mのために書類からの文字イメージを分割し正常化する前1プロセツサ、及び この神経網によって成された誤記号識別を直す後置プロセッサを有する光学的文 字認識システムである0本発明の代替実施例において、前置プロセッサは他の方 法では分離不可能な文字イメージ、例えば飾り付けられた文字のイメージを分離 するために、接触された成分分析によって個々の文字イメージを分割する。
本発明のこの代替実施例において、接触文字は後置プロセッサによって達成され る接続成分分析において分離される。この実施例において、後置プロセッサは、 より大きな対象に接続されていると見い出された際に接続成分分析によってより 大きな対象に究極的に併合される各対象を覚えている。イメージにおけるこれら 全ての対象が見い出されると、後置ブロセ/すはこれら併合された対象のどれか が神経網が認識するように訓練された全ての記号の中央高さ又は領域の近(の高 さ又は領域を有するか否かを決定する。そうである場合、後置プロセッサはより 大きな対象からこの基準に合致する併合された対象を分離する。斯かる場合、併 合された対象は接触文字であり、文字正常化器の入力に別々にフィードバックさ れ次に神経網にフィードバンクされる。
本発明のこの好ましい実施例において、前置プロセッサはより高速であるが強度 がより低い分割技術、例えばヒストグラミングを用いており、一方装置プロセッ サは神経網によって発生される記号得点を監視する。文字イメージのアスペクト 比(幅側る高さ)が所定のしきい値より大きい場合あるいは神経網からの低い記 号点を検出した場合、後置プロセッサにおける腕節プロセッサはこの高いアスペ クト比即ち低い点を改善するために所定の一連の試みを達成する。大抵の場合、 これらの試みの各々は先jテの試みより時間を消費する。先ず、後置プロセンサ は文字イメージが文字正常化の後特定の既知の文字から区別不可能である1組の 特別な記号の1つを含むか否かを決定する。そうである場合、後置プロセッサは 神経網の記号選択を無視し、特別な文字を識別する。そうでない場合、後置プロ セッサは神経網によって選択された記号がそのケースが文字正常化に続いて未定 である記号であるか否かを決定する。そうである場合、後置プロセッサは元の( 正常化されていない)文字イメージの寸法から文字の適切なケースを決定する。
そうでない場合、この文字イメージは2つの飾り付けられた記号の文字イメージ であるという仮定がなされ、後置プロセッサにおける腕節プロセッサは2つの飾 り付けられた文字を分離しようとして接続成分分析を達成する。このようにして 、時間を消費する接続成分分析プロセッサは、特定の文字イメージに対して必要 であると見い出されない限り用いられない、腕節プロセッサがイメージを2つ以 上の文字に分離するのに成功した場合、この結果は文字認識における新しい試み のために神経網の入力にフィードバックされる。接続成分分析の利点は、それが rオン」画素の連続領域からのみなるイメージにおける断接された対象を画定す ることにより隣接文字イメージを分離することである。斯くして、これらの領域 が飾り付けされているか否かを問わず、接続成分プロセンサは未接続領域を分離 する。これらの領域の各々は次に別々に正常化されて神経網に転送される。
そうでない場合、本発明のこの好ましい実施例において、接触文字分離は、接触 文字の分離に排他的に割り当てられている接触文字分離プロセッサによって後置 プロセッサにおいて達成される。この接触文字分離器プロセッサによって達成さ れるプロセスは腕筋プロセッサのプロセスよりも時間を消費するため、後置プロ セッサは腕筋プロセッサが文字イメージの分離ができない場合にのみ接触文字分 離器プロセッサを用いる。接触文字分離器プロセッサは9個のそれぞれの分離試 行プロセスを所定の順序で試みることにより同一のイメージにおける2つの未知 の文字間の分離点を決定する。各連続試行プロセスは、次の試行プロセスの仮定 が存在しないという1組の仮定可能を解消するため、各々の後続の試行プロセス のタスクを簡略にする。この9個の試行プロセスの任意の1つの成功の際、新し く分離された文字イメージのこの対は一度に1つずつ文字正常化器の入力に、従 って分離の正しさを証明するために神経網にフィードバックされる。
特定の文字イメージが低い得点でもって神経網によって識別された場合且つ腕筋 プロセッサと接触文字分離器プロセッサの両方が文字イメージを2つ以上の文− 字イメージに分離することができない場合、本発明のこの好ましい実施例では、 文字イメージは推測プロセッサに転送される。推測プロセッサは、神経網によっ てなされた第2及び第3高得点記号選択のどちらが問題の文字イメージの文字高 さに合致する文字高さを有しているかを決定し、その記号選択を勝者として宣言 する。しかしながら、第2及び第3記号選択が文字イメージの文字高さと合致す る文字高さを有する場合、推測プロセッサはこの2つの選択のどれが第1の選択 と最も混同される可能性があるかを決定し、それを勝者と宣言する。
腕節(接続成分分析)プロセス及び接触文字分離プロセスは、先行特別記号検出 及びケース補正プロセスより漸次に時間消費的である。本発明の1つの利点は、 神経網の出力が、腕節、分離及び推測プロセスが達成されるか否かを各文字イメ ージに対して決定し、これによりそれらの各々が必要な場合にのみ用いられるよ うにすることである。詳細には、本発明のシステムは特定の文字イメージが特に 高いアスペクト比を有するかあるいは許容できない程低い得点を有する神経網に よって記号選択を刺激する場合のみ斯かる対策プロセスの力を借りる。斯くして 、全体のシステムオペレーションの速度は、必要となった場合に腕節プロセス、 接触文字分離プロセス及び推測プロセスの利点を享受しながら最適化される。
図面の簡単な説明 本発明の好ましい実施例は添付図面に言及して以下に詳細に述べられており、こ れらの図面において、 第1a図及びlb図は、1対の飾り付は文字及び1対の接触文字をそれぞれ示す 図であり、 第2図は本発明の代替実施例を示しており、第3図は本発明を実施する好ましい システムのブロック図であり、第4図は、第3図のシステムのオペレーションを 示すフローダイアグラムであり、 第5図は、書類の例示イメージの簡易図であり、第6図は、第5図の書類イメー ジから分離された文字イメージの簡易図であり、第7図は、本発明に用いられて いる異なった記号高さ分類を示す図であり、第8図は、第3図のシステムにおけ る基準パラメータユニットのオペレーションを示すフローダイアグラムであり、 第9図は、第3図のシステムにおける文字正常化器によって生成された第6図の 文字イメージの未正常化形を示す図であり、第1O図は、第3図のシステムにお ける神経網の典型的な部分の簡易図であり、第11図は、第3図のシステムにお ける特殊記号検出器のオペレーションを示すフローダイアグラムであり、 第12図は、第3図のシステムにおけるケース補正器のオペレーションを示すフ ローダイアグラムであり、 第13図は、第3図のシステムにおける腕節器のオペレーションを示すフローダ イアグラムであり、 第14図は、第3図のシステムにおける腕節器によって用いられている隣接画素 の可動核の図であり、 第15図は、第3図のシステムにおける接触文字分離器のオペレーションを示す 一般フローダイアグラムであり、 第16図乃至24図は、第15図に示されている接触文字分離器のオペレーショ ンにおいて用いられている9個の接触文字分離プロセスのそれぞれの1つのオペ レージタンを別々に示すフローダイアグラムであり、第25図は、新しいイメー ジが第15図の接触文字オペレーションに如何に組み込まれるかを示しており、 第26図は、文字イメージの不正分割に対して保護する第15図の接触分離オペ レーションにおいて用いられている検査分割オペレーションを示しており、第2 7図は、第26図の検査分割オペレーションに用いられている一般検査プロセス を示しており、 第28図は、第3図のシステムにおける推測プロセッサのオペレーションを示す フローダイアグラムであり、 第29図は、完全な記号組におけるどの記号が第3図のシステムにおける神経網 によって選択される特定の記号と混同される可能性が最も高いかを決定する上で 有用なルックアップテーブルを示しており、そして第30図は、第3図のシステ ムによって用いられている二進文字イメージワードのフォーマットを示す図であ る。
本発明を実施するモード 之丞土人概説 本発明の代替実施例が第2図のブロック図に示されている。光学的文字認識シス テム200は接続成分分析器210及び文字正常化器215を含む前置プロセッ サ205、文字認識神経網220並びにケース混同補正を達成する後置プロセン サ225からなっている。接続成分分析器210は、文字イメージの各々を全書 類のイメージから分離する。接続成分分析器を用いて、分析器210は隣接文字 のイメージをこれらの文字が飾り付けられている場合に互いに分離する。文字正 常化器215は、分析器210によって供給される個々の文字イメージによって 占有される水平行の画素及び垂直列の画素の数を決定する。文字イメージ又は対 象によって占有される水平行及び垂直列の画素の数が神経網220によって要求 されるイメージ寸法から異なる場合、標準化器215は、古い文字イメージに基 づくが所望数の水平行及び垂直列の画素を占有する正常化された文字イメージを 発生する。神経網220は正常化された文字イメージからそれが認識するように 訓練された組の記号における各記号に対する異なった得点を発生する。神経網2 20は次に最高得点を有する記号を文字イメージによって表わされる記号として 宣言する。後置プロセッサ225は、神経網によってこのように識別される記号 がその上及び下ケース形が形状の点で同等であり且つ従って寸法の差のみによっ て互いに区別される記号であるかを決定する(勿論斯かる寸法の差は文字標準化 器215によって達成される文字正常化プロセスの間に失われる)、そうである 場合、後置プロセッサ225は接続成分分析器210によって文字正常化器21 5に転送された元の(未正常化)イメージの寸法に言及することにより現在の記 号が上又は下ケースであるかを決定する。斯かる結果を予想して、元のイメージ はそれが分析器210によって正常化器215に転送された時点でメモリ230 に記憶される。斯くして、後置プロセッサ225は単に、メモリ230に記憶さ れているイメージの寸法を決定する。大寸法が上ケース記号を示すのに対して、 小さな寸法は下ケース記号を示す。補正が必要であると見い出された場合、後置 プロセッサ225は神経!220によって供給された記号を適当なケースの記号 に置き換える。第2図のエレメントの各々は第3図に示されている本発明の好ま しい実施例に関連して以下により詳細に論じられよう。
ここで第3図について説明すると、本発明の好ましい実施例は、周知の技術、例 えばイメージの水平行及び垂直列に沿ったヒストグラミングを用いて書類イメー ジ305を複数の別々の文字イメージに分割する文字分割器300を含んでいる 。各文字イメージは個別に文字パラメータユニット310に送られ、文字パラメ ータユニット310は各文字イメージのパラメータ、例えば文字高さを計算する 。斯かるパラメータは第3図のシステムの他の成分による使用のためにメモリ3 15に記憶される0個々の文字イメージは次に周知の技術を用いて文字正常化器 320によって所定の寸法及びアスペクト比に正常化される。好ましい実施例に おいて、正常化された文字イメージは12の垂直列及び24の水平行の二進法画 素からなる0分割器300、文字パラメータユニット310、メモリ315及び 文字正常化器320は第3図の好ましい実施例の前置プロセッサ325を構成し ている。
前置プロセッサ325は正常化された文字イメージを神経1i330の入力に転 送する。神経m330は所定組の記号の各々を認識するように訓練されている。
神経網330は所定組における記号の各々の1つに対する正常化されたイメージ の異なった得点を発生し、最高得点を有する記号を文字イメージによって表わさ れる記号であると宣言する。神経網330はこの識別及び現在の文字イメージに 対する第1、第2及び第3の高得点記号の対応の得点を後置プロセッサ340に 送る。後置プロセッサ340は神経網330によってなされた記号識別が信頼性 のあるものであるか否かを決定する。そうでない場合、後1プロセツサ340は 現在の文字イメージに対するより信頼性の高い記号の選択を見い出すために補正 又は対策タスクを達成する。
後置プロセッサ340におけるケース補正器342ばそのケース識別が文字正常 化の後曖昧である記号のケース(上又は下)を補正するタスクを達成する。この タスクは第2図の後置プロセッサ225に関連して上で述べられた。しかしなが ら、第3図のケース補正器342は神経網によって識別された記号の適当なケー スを決定するために元の文字イメージから文字寸法を計算せず、単に前に文字パ ラメータユニット310によって計算され且つメモリ315に記憶されている元 の文字イメージの寸法を参照するだけである。
特殊記号検出器344は、元の文字イメージ寸法が、表わされる文字が神経網が 認識するように訓練された文字でないことを示すか否かを決定する。斯かる記号 は、例えば、コンマ又はピリオドあるいはその正常化されていないイメージが神 経網の記号組における特定の記号から区別不可能である他の任意の記号であり得 る。(ピリオドの正常化されているイメージは「0」と混同され得る。斯かる場 合は、特殊記号を検出器がこの文字イメージの識別を決定する。)腕節器346 は飾り付けされ得る書類イメージ305における隣接の文字イメージを分離する 。好ましくは、この腕節器346は接続成分分析を用いる。腕節器346が1つ の文字イメージを2つ又はそれ以上の文字イメージに分割できた時は必ず、その 結果得られるイメージは神経網330による最終的な処理のために文字正常化器 320の入力にフィードバックされる。
接触文字分離器348は、実際に接触しており且つ従って分割器300あるいは 腕節器346のどちらかによる分離に容易に供することができない書類イメージ における隣接の文字イメージを分離する0分離器34Bが1つの文字イメージを 2つ又はそれ以上の文字イメージに分割できた場合は必ず、その結果得られるイ メージは神経網330による最終的な処理のために文字正常化器320の入力に フィードバックされる。神経網によってなされた信顧できない文字識別が後置プ ロセッサ340の上記のエレメントのどれによっても補正されない特別な場合は 、推測プロセッサ350は現在の文字イメージのためにメモリ315に記憶され ている文字パラメータの全てを考慮に入れ、これにより現在の文字イメージの記 号識別のための最上の推測を決定する。
第3図のシステムのオペレーションをこれから第4図の作動フローダイアダラム に言及して一般的に述べることにする。第4図は、第3図のシステムが書類イメ ージ305における個々の文字イメージの各水平行又はラインをいかに処理する かを時間シーケンスで示している。先ず、文字分割器300は一行の文字イメー ジを受け、個々の文字イメージをその行に分割することを開始する(第4図のブ ロック400)。現在の行における文字イメージの全てが分割器300によって このように処理された後、これらはそれぞれ1度に1つずつ文字正常化器320 に送られる(第4図のブロック404)、この文字イメージの正常化された形は 神経網330によって処理され、神経網330は恐らくは文字イメージによって 表わされる記号を識別する(第4図のブロック406)。基準パラメータユニッ ト310は文字イメージにおける連続「オン」画素からなる対象の種々のパラメ ータ(高さ及び面積等)を計算しこれらをメモリ315に記憶する(第4図のブ ロック407)。神経網330によってなされる記号の選択が補正されなければ ならないか否かは次に後置プロセッサ340によって決定される。先ず、特殊記 号検出器344は、元の(未正常化)文字イメージの面積又は高さ一メモリ31 5に記憶されている−が所定のしきい値を下回ったか否かを決定する。(第4図 のブロック408)、そうである場合(ブロック408のYES分岐)、特殊記 号検出器344は神経網の決定を無視し、文字イメージが実際に表わす特殊記号 を検出しく第4図のブロック410)そして正記号識別を出力する(第4図のブ ロック410)。そうでない場合(ブロック408のNo分岐)、ケース補正器 342は神経!1i330によって識別された記号がそのケースが曖昧である記 号であるか否かを決定する(第4図のブロック414)。そうである場合(ブロ ック414のYES分岐)、ケース補正器342は元の(未正常化)文字イメー ジの一メモリ315に記憶されている一寸法又は面積からケース(上又は下)を 確認する。そうでない場合(ブロック414のNo分岐)、ケース補正器342 は回避される6次に、現在の文字イメージに関連する記号に対する神経網によっ て計算された点が信転度の所定しきい値を下回るかあるいは文字イメージのアス ペクト比が高すぎるか否かについての決定がなされる(第4図のブロック418 )。
そうでない場合(ブロック418のNo分岐)、神経劇の記号識別は信頼性があ るものと考えられ、これは最終結果として転送される(第4図のブロック420 )。
そうでない場合(ブロック418のYES分岐)、低い得点あるいは高アスペク ト比は分割器300が書類イメージ305における2つ(又はそれ以上)の隣接 した文字イメージを分離できないことに因るという仮定がなされる。この場合、 現在の文字イメージの腕筋がすでに試みられているか否かの決定が先ずなされる (第4図のブロック422)。そうでない場合、腕節器346は文字イメージを 2つ又はそれ以上の別々のイメージに分離することを試みる(ブロック424) 。
現在の文字イメージからより多くの別々の対象を形成することが成功した場合( 第4図のブロック426のYES分岐)、その結果得られる新しい文字イメージ は一度に1つずつ文字標準化器の入力にフィードバックされ、これによりこの新 しいイメージがそれぞれ上記のプロセスに供されるようになっている。腕節器3 46が現在の文字イメージを2つの別々のイメージに分離することができない場 合(ブロック42GのNo分岐)、この文字イメージは接触文字分離器348に 送られる。しかしながら、現在の文字イメージの腕筋が既に試みられている場合 (ブロック422のYES分岐)、接触文字分離プロセスが分離器348によっ て現在の文字イメージに対して達成されているか否かについての決定がなされる (第4図のブロック428)。そうでない場合(ブロック428のNo分岐)、 分離器348はその接触文字分離プロセスを現在の文字イメージに対して達成す る(第4図のブロック430)。接触文字分離プロセスが現在の文字イメージを 2つに分層することに成功した場合(第4図のブロック432のYES分岐)、 その結果得られる新しい文字イメージは一度に1つずつ文字正常化器320の入 力にフィードバックされ、これによりこれらの新しいイメージが各々上記のプロ セスに供されるようにしている。接触文字分離プロセスが現在の文字イメージを 2つの別々の対象に分離することができなかった場合(ブロック432のNo分 岐〕、現在の文字イメージは推測プロセッサ350に送られる。しかしながら、 接触文字分離プロセスが既に現在の文字イメージに対して達成されている場合( ブロック428のYES分岐)、分離器348は回避され、現在の文字イメージ は直接推測プロセッサ350に送られる。推測プロセッサ350は神経網330 によってなされた記号識別を補正することを試み(第4図のブロック434)、 現在の文字イメージの適切な記号識別のその最上の推測を出力する(第4図のブ ロック436)、最終的な記号識別が後置プロセッサ340によってなされると 必ず(第4図のブロック412、ブロック420あるいはブロック436L現在 の行における次の文字イメージが文字正常化器320の入力に送られ(ブロック 404)オペレーションの次のサイクルを開始する。
第3図のシステムにおけるエレメントの各々は以下に詳細に述べられる。
ス字丘側五 文字分割器300は、書類の二進イメージにおける隣接の文字を分離して個々の 文字イメージを発生する。これは実質的に、画素の全てがrオフ」である水平行 又は垂直列の画素を単に探す周知のヒストグラミング技術を用いて行う。かかる 行又は列は連続の「オン」画素を含む2つの隣接の対象に分離する境界として取 り扱われる0例えば、書類イメージ305は二進法画素の垂直列及び水平行のタ スクを含む第5図に示されている二進法イメージのように見え得る。「a」50 5及び’bJ510のイメージに対する「オン」画素は「オフ」画素の垂直列5 15によってのみ分離される0分割器300「オフ」画素の列515の定位を用 いて2つの対象505及び510を分離してこれにより第6図に示されている連 続の「オンJ画素の「b」対象510の個々の二進法文字イメージを発生する。
分割器300によって達成されたプロセスは当技術において周知であるため、こ れ以上の説明はここでは必要でない。
バーノー ユニ ト 文字パラメータユニットは、個々の文字イメージ、例えば分割器300によって 生成された第6図の文字イメージを検査し、イメージにおけるFオンJN素の最 も高い列における画素の数と同時にイメージにおけるrオン」画素の最も長い行 における画素の数を計数する。これらの数はそれぞれ文字イメージの高さ及び幅 である0文字パラメータユニットはまた、文字の現在の行における文字の全てに 特有な第7図に示されている特定のパラメータを決定する。これらのパラメータ は現在の行における文字の全てに共通なベースライン700に対して相対的に測 定される。中間ライン705は「a」等の平均的な小文字の頂部である。上昇ラ イン710は、「1」又は「j」等の平均的な高い文字の頂部である。下降ライ ン715は、Ej」、「y」又は’PJ等の下方延長を有する文字の底部である 。パラメータユニット310はここでは手の込んでいる必要がない当技術におい て周知の技術を用いて、現在の文字イメージの高さ及び幅、並びに現在の行にお ける文字の全てに特有なベースライン700に対する相対的な中間ライン705 、上昇ライン710及び下陣ライン715の定位を含むパラメータの各々を測定 する。
文字基準パラメータユニット310のオペレーションは第8図のフローダイアダ ラムに示されている。基準パラメータユニット310は分割器300からの元の (未正常化)文字イメージを受けるだけでなく、神経網330によって識別され た記号の対応の得点を受ける。文字イメージに対する記号の神経網の識別がそれ が第4図のブロック420に至るテストを首尾よく通過したという意味で「最終 的」であるかの決定がなされる。この決定は第8図のブロック800に相当する 。そうである場合(ブロック800のYES分岐)、基準パラメータユニット3 10はそのベースラインに対する相対的な現在の文字イメージの中間ライン高さ 、上昇ライン高さ及び下降ライン高さく第7図に示されている)を決定する。
そうでない場合(ブロック8000)No分岐)、神経網によって発生された得 点が神経網によってなされた記号の選択が信転性のあるものであることを指示す るのに十分高いかの決定がなされる。この後者の決定は第8図のブロック802 に相当する。そうである場合(ブロック802のYES分岐)、基準パラメータ ユニット310はそのベースラインに対して相対的な現在の文字イメージの中間 ライン高さ、上昇ライン高さ及び下降ライン高さく第7図に示されている)を決 定する。そうでない場合(ブロック802のNo分岐)、現在の文字イメージは 基準パラメータユニットによって回避され、この基準パラメータユニットは次の 文字イメージに対して前記のプロセスを反復する。基準パラメータユニット31 0はC言語コンピュータプログラムによって実施された。このプログラムは基準 パラメータユニット310に関連して上で論じられた基準値を計算するのにプロ グラムによって用いられるイメージから文字データ構造を形成する。加うるに、 このプログラムは計数補正器342の且つ下で論じられる特殊記号検出器344 の機能を実施する。
文字正常化器 文字正常化器320は、元の文字イメージの寸法及び/又はアスペクト比を必要 に応じて変化せしめる0例えば、12列及び24行の二進画素、例えば第9図に 示されている文字イメージを含む文字イメージを認識するように訓練された神経 網が本発明で用いられた。第6図の元の文字の例はこの形状に一致せず、比較に 値しない。文字正常化器320は形状を変化せしめ、これにより神経網330に よって要求される12列、24行二進法イメージに一致するようにしている。
この結果は第9図に示されており、この中で文字(b)の正常化されたイメージ は第6図の元の文字より高く且つ細くなっている。
笠扛岩 第10図のブロック図は第3図の神経m330の典型的な部分を示している。
神経網330は約288個(D入力層 −F 905 a、905b、905c 等を含ム入力層900を有している。各入力ノード905は第9図の正常化され た12×24文字イメージにおける288個の二進法画素の特定の1つに接続さ れている。
入力ノード905の全ては言わゆる隠された層915における75本の神経91 0a、9101)、910c等の各々に個別に接続されている。各入力ノード9 05はそれが隠された層の神経910の各々の1つに接続されている特定の文字 イメージ画素の二進法状態に沿って単に通過する。本明細書の以下にある程度詳 細に述べられるように、これらの神経910の各々の1つはその288個の二進 法人力の全てを用いる演算活発化機能を達成して出力を発生する。全ての75本 の隠された層の神経910の出力は出力層925における51本の神経920a 、920b、920c等の各々の1つに接続されている。51本の神経920の 各々は神経網330が認識するように訓練されている51個の英数字記号の1つ に相当する。(斯かる訓練は以下に定義されよう、)51本の神経920の各々 の1つは隠された層9】5からの全ての75個の出力を用いて演算活発化機能を 達成しそれ自身の最終出力を発生する。この最終的な出力は得点であり且つ人力 層900において受けられた正常化された文字イメージとこの得点を発生した神 経920に関連する記号との間の相関関係に類匍している。斯くして、入力層9 00において受けられた各文字イメージに対して、51個の得点が51個の出力 神経920によって出力層925において発生される。最も高い点を発生した出 力神経に関連する記号は入力層900において受けられた文字イメージによって 表わされる記号として宣言される。
神経網の最も単純な例は、各神経によって達成される活発化機能が単にこれらの 入力とこの神経のそれぞれの係数との積の和である神経網である。第10図につ いて説明すると、この単純な例において、二進法人力Aiが288個の入力ノー ド905の1番目のノードにおいて受けられ、そこから隠された層915におけ る75本の神経910の全てに転送される。隠れた層915における神経910 のj番目の神経は人力A101番目の入力に係数Btjを乗算し、次に全ての2 88個の積AiBijの和に等しい出力Cjを発生する。斯くして、Cj=Σ1 AiBij 同様にして、出力層925における出力神経920のに番目の神経は隠れた層9 15から受けられた出力Cjのj番目の出力に係数Djkを乗算し、次に全ての 積CjDjkの和に等しい出力得点Ekを発生する。斯くして、Ek−ΣjCj Djk 288個の二進法人力Aiに換算した51個の出力得点Ekを得るために、公式 (1)は公式(2)に置換されて、 Ek=ΣiΣjDjkBi jAi を得る。
斯かる単純な神経網のオペレーションは公式(3)に因って容易に要約されるが 、当技術において周知であるように、各神経によって達成される単純な積の和活 発化関数の直線性に因って安定していない。非直線活発化関数がその代わりに用 いられる場合に安定が達成される。詳細には、中間層915における各神経に対 する活発化関数は、 Cj= [1+exp (−Σ1(AiBij+θj))一方出力層925にお ける各神経に対する活発化関数は、Ek= (1+exp (−Ej (cip jk+θk))以下に詳細に論じられるように、係数BIJ及びDjkは既知記 号組における各正常化文字イメージの288個の二進法画素が288個の人力ノ ード905に適用される神経網によって達成される訓練プロセスの過程の期間中 に学習される。
この訓練プロセスの間、上記の公式(4)及び(5)における項θj及びθには 、入力層における且つ前の層には未接続であるが次の層に「オン」信号を一定し て出力する隠された層におけ仮作的神経の出力としてそれぞれ学習される。この 技術は当技術において周知である。上記の光学的文字認識神経網はC言語コンピ ュータプログラムを用いて実施された。
ここで神経網の訓練を定質的に述べることにする。神経網によって認識される各 記号の12X24文字イメージは反復学習プロセスにおいて多数回288個の入 力ノードに適用される0文字イメージが適用されるたびに、出力層における各神 経920の出力は所望パターンと比較されて誤差を得る。勿論所望パターンは、 適用された文字イメージによって表わされる記号に割り当てられた特定の出力神 経(例えば神経920c)のみが単一の点を生成するのに対して、他の全ての出 力神経はゼロの得点を生成する。に番目の出力神経に対しては、所望得点はt、 にと表わされ一方その実際の出力得点はOkと表わされる。k番目の出力神経に 対する誤差δには以下のように定義される。
δに= (tk −ok ) (6ok /δ(n e tk )ここでδok /δ(netk)は上記の公式の出力神経活発化関数の実際の出力Okに対する 偏重関数である。
既知文字イメージの入力層900への各々の通用に続いて、誤差δには各出力神 経920に対して計算され、同時に隠れた層915から各出力神経920によっ て受けられた75個の入力1jの各々の大きさも計算される。に番目の出力神経 によって用いられる係数Djkの各々は反復量Djkによって変化し、この反復 量Djkによって変化し、この反復蓋Djには以下のように定義される。
Djk=δkIj十αDjk’ ここでδは訓練プロセスの学習速度を表わす単一よりも小さな比例定数であり、 δk及びIjは上記のように定義され、一方Djk“は先行反復の期間中にDj kが変化する量であり、αは学習プロセスの安定に寄与する運動量項目である。
本発明においてαは約0. 9である。
隠れた層の神経910の係数Bijは上記に与えられた定義と類イ以の定義を用 いて同一のプロセスの期間中に学習される。しかしながら、冬服れた層の神経に 対する誤差δjは次の反復的な関係式に従って異なって定義される。
δj=(δoj/δ (net j) (ΣにδkDjk)従って、隠れた層の 神経910の5番目の神経の係数Bjjは既知文字イメージの入力層900への 各適用と共に以下に定義される量δBijだけ変化する。
Bij=δjAi 公式(9)の右辺の項の各々は上記で定義されている。
訓練プロセス全体は、51個の出力得点の所望パターンがこの文字イメージに対 して達成されるまで、既知の文字イメージを神経網の人力層900に反復的に適 用し、各神経の係数を上記の公式(7)及び(9)に従って変えることにより達 成される。このプロセスは、1組の英数字記号を表わす全ての文字イメージがこ のように処理されるまで次の既知文字イメージに対して反復される。斯かる訓練 プロセスはC言語プログラムを用いて実施された。
竺珠記ユ挟土器 第3図の特殊記号検出器344のオペレーションが第11図のフローダイヤグラ ムに示されている。先ず、文字基準パラメータユニット310は元の文字イメー ジにおける連続「オン」画素の対象の高さ及び幅だけでなく現在の行における全 ての文字のベースライン定位に対するその位置を決定し、これらのパラメータを 前に論じたメモリ315に記憶する(第11図のブロック1100)、特殊記号 検出器344は先ず、(文字対象の幅に対する高さの)アスペクト比が0. 5 より小さいか否かを決定する(第11図のブロック1110)、そうである場合 (ブロック1110のYES分岐)、検出器344は文字対象が下降ラインの底 部の近くに定位しているか否かを決定する(第11図のブロック1115)。そ うである場合(ブロック1115のYES分岐)、特殊記号検出器344はこの 文字イメージを下線記号(−)として識別する(第11図のブロック1120) 。
そうでない場合(ブロック1115のNo分岐)、特殊記号検出器はこの文字イ メージをダッシュ(−)として識別する(第11図のブロック1125)。アス ペクト比が0. 5を下回らない場合(ブロック111oのNo分岐)、検出器 344は文字対象が底部即ち下降線定位の近くにあるが否がを決定する(第11 図のブロック1130)、そうである場合(ブロック113oのYES分岐)、 検出器344は文字対象のアスペクト比が1.25より大きいが否かを決定する (第11図のブロック1135)、そうである場合(ブロック1135のYES 分岐)、検出器344はこの文字イメージをコンマ(1)として識別する(第1 1図のブロック1140)、そうでない場合(ブロック1135ONo分岐)、 検出器344はこの文字イメージをピリオド(、)として識別する(第11図の ブロック1145)、ブロック1130の決定が否定的であった場合(ブロック 1130のNo分岐)、検出器344は次に文字対象のアスペクト比が1.2よ り大きいか否かを決定する(ブロック1150)、そうである場合(ブロック1 150のYES分岐)、検出器はこの文字イメージを単一引用符(゛)として識 別する(第11図のブロック1155)、そうでない場合(ブロック115゜の No分岐)、検出器344はこの文字イメージを二重引用符(”)として識別す る(第H図のブロック1160)、これは全ての妥当な可能性を消費し従って与 えられた文字イメージに対して特殊記号検出器344によって達成されたプロセ スを含む。検出器344が文字イメージを特定の特殊記号として識別する時は必 ず(ブロック1120.1125.1140.1145.1155又は1160 におけるように)、斯かる識別は神経網330の出力を無視することを銘記すべ きである。
特殊記号検出器344は神経網がこのように識別された記号に対して非常に高い 得点を発生したか否かに拘わらず上記の状況の下で神経網330によってなされ た記号識別を無視する。斯くして、特殊記号検出器344はある意味で神経網3 30の出力から独立している。しかしながら、特殊記号検出器344はそれが基 準パラメータユニット310の出力に錬っているため神経網330の出力に間接 的に依存する。基準パラメータユニット310は、ベースライン定位等の幾何学 的特徴及び上記のこれに対する相対的な種々の文字パラメータを計算するために 記号が信顛的に識別されることを要求する。
欠二丞補正M ゛ ケース補正器342のオペレーションが第12図のフローダイアグラムに示され ている。ケース補正器342は先ず、神経網が現在の文字イメージを文字「PJ として識別したかを決定する(第12図のブロック1200)、そうである場合 (ブロック1200のYES分岐)、補正器342は元の文字イメージにおける 連続「オンJWi素の対象が文字ベースラインの下に延長したか否かをメモリ3 15に記憶されている基準パラメータから決定する(第12図のブロック120 5)。
そうである場合(ブロック1205のYES分岐)、ケース補正器342ばこの 文字イメージを下ケース(小)文字「p」として識別する(第12図のブロック 1210)、そうでない場合(ブロック1205のNo分岐)、補正器342は この文字イメージを上ケース(大文字)「P」として識別する(第12図のブロ ック1215)。神経M4330によって識別される記号が’PJでない場合( ブロック1200のNo分岐)、ケース補正器342は次に、文字イメージにお ける連続画素の対象が低い高さを有するか否かを検定し、これにより第7図にお いて定義されたようにこれが中間ラインの上あるいはベースラインの下に延長し ないようにしている(第12図のブロック1220)、そうである場合(ブロッ ク1220のYES分岐)、ケース補正器342は神経網によって識別された記 号のケースが下ケース(小)であることを決定する(第12図のブロック122 5)。
そうでない場合(ブロック1220のNo分岐)、ケース補正器342は神経網 によって識別された記号のケースが上ケースC大)であることを決定する(第1 2図のブロック1230)。
履飾器 第3図の腕節器346のオペレーションが第13図のフローダイアグラムに示さ れている。第4図に関連して前に論じられたように、現在の文字イメージに対し て神経網330によって発生された最高得点が信鎖できるには低すぎるがあるい はアスペクト比が大きすぎる場合は必ず、この文字イメージが実際に、分割器3 00が分離することができなかった文字であるという仮定がなされる。イメージ におけるこの2つの文字を分離する最初の試みは腕節器346によってなされる 。腕節器346はこれらの文字が例えば第1a図に示されている様式で飾り付け られている場合は現在のイメージにおける個々の文字を分離することに成功しよ う。
ここで第13図に示されているオペレーションについて説明すると、腕節器34 6は画素の最左垂直列から始めることにより現在の文字イメージ(第9図にこの 列の頂部から始めて(第13図のブロック1305)この列を下に降りて最初の rオンJ画素に至る(第13図のブロック1310)、腕節器346は次に、こ れら4つの先行する隣接画素の任意がrオンJであるかを決定し、そうである場 合、任意の斯かる画素にラベルが割り当てられているかを決定する(第13図の ブロック1315)、これら4つの先行隣接画素は第9図の未正常化イメージの 一部分の図である第14図に示されている。現在の画素は第14図の図において ’PJとして表わされており、一方先行の隣接画素は地理的にそれぞれrNWJ 、「N」、「W」及びrsW、として表わされている。これら4つの隣接画素の どれもラベルを付けられていない場合(ブロック1320のNo分岐)、整数の リストにおける次の数が新しいラベルとして選択され(第13図のブロック13 25)、そしてこのラベルは第14図における現在の画素’PJに割り当てられ る。(第13図のブロック1330)、このラベルだけでなくこのラベルが割り 当てられた「オン」画素の定位を腕節H346のメモリ346aに記憶される( 第3図参照)、他方、メモリ346aの内容が、先行の隣接画素の1つ又はそれ 以上が前にラベルを付けられていること(ブロック1320のYES分岐)を示 す場合、且つ1つの斯かるラベルのみが存在する場合(第13図のブロック13 35のYES分岐)、前に割り当てられたこの1つのラベルが現在の画素に割り 当てられた(ブロック1330)現在のラベルとして用いられる(ブロック13 40)。
しかしながら、2つ以上の前のラベルが存在する場合(ブロック1335のNo 分岐)及び実際先行の隣接画素の異なった画素に既に割り当てられた2つ(又は それ以上)のラベルが存在する場合(第13図のブロック1345のYES分岐 )、先行のラベルは両方共同−の数に変化しく第13図のブロック1350)そ してこの後者の数は現在の画素のラベルとして割り当てられる(ブロック133 0)。
一方、この時点において腕節器346が3つ以上の前のラベルを見い出した場合 (ブロック1345のNo分岐)、誤差がフラグされる(第13図のブロック1 355)。
現在の画素「p」 (第14図)がブロック1330においてラベルを付けられ た後、腕節器346はこれが第9図の未正常化文字イメージにおける画素の現在 の列における「オン」画素の最後(最低)であったか否かを決定する(第13図 のブロック1360)、そうでない場合(ブロック1360のNo分岐)、腕節 器346はこの列における次の画素に下降しくブロック1310)、そして前記 のプロセスを再開する。そうでない場合、これがこの列における最後の「オン」 画素である場合(ブロック1360のYES分岐)、腕節器は次に、この現在の 列が文字イメージにおける最後(最古)列であるか否かを決定する(第13図の ブロック1365)。そうでない場合(ブロック1365のNo分岐)、腕節器 346は文字イメージにおける次の垂直列に向かって左方に移動しく第13図の ブロック1370)、新しい列の頂部に至り(ブロック1305)そして前記の プロセスを再開する。そうでない場合(ブロック1365のYES分岐)、現在 の文字イメージの処理が終了する。前記のプロセスは接続成分分析である。
次に、腕節器346は前記のプロセスにおいて新しいラベルを不適切に付けられ た任意の副対象、例えば文字i又は」の上のドツトあるいはコロン(:)または セミコロンに)の上のドツトを再結合する(第13図のブロック1375)。
この段階は、これらの副対象の1つが他方の上に完全に重なっていることを要求 する。これは、その寸法(連続rオン」画素の数)がしきい値の数より小さい任 意の斯かる副対象をそれが分離された先行の対象に再結合することにより行われ る。勿論、このしきい値の数は斯かるドツトによって典型的に占有された画素の 数に依存する。最終的に、腕節器346は連続「オン」画素の各々の別々にラベ ルを付けられた対象を出力する(第13図のブロック1380)。
第2図に基づいて上記に述べられた本発明の代替実施例において、第2図の接続 成分分析器210は、ブロック1385の付加的な段階が第13図の破線におい て示されているようにブロック1375と1380の段階の間に挿入された状態 で、第13図のプロセスを達成する。ブロック1385の付加的な段階によって 、接続成分分析器は文字イメージにおける接触記号少なくとも有意な程度まで分 離することができる。詳細には、これらの対象はブロック1375の段階におい て定義された後、ブロック1385の接触文字分離段階は以下のように進行する 。先ず、ブロック1350の段階において副対象として結合された各々の別々の ラベルを付けられた対象の寸法が書類における記号の平均寸法と比較される(ブ ロック1390)、次に、任意の斯かる副対象は書類における記号の平均の所定 のしきい値内の寸法を有すると見い出された場合、この副対象はより大きな対象 から分離され、それ自身のラベルを有する個々の対象としてその前の状態に復帰 する(ブロック1395)。
接触文字分離器q概説 接触文字分離器348のオペレーションが第15図のフローダイアグラムに全体 的に示されている。接触文字分離器348によって受けられた文字イメージは独 特の論理シーケンスにある9個の異なった分割プロセスに順次に供される。先ず 、接触文字分離器348は文字イメージをイメージの底部において2つのイメー ジに分割する時点を見い出すことを試みる(第15図のブロック1510) 。
このオペレーションは本明細書において後に詳細に述べられる。この文字イメー ジを分割する試みが失敗すると、分離器348は次に本明細書において後に述べ られる独特の様式でもって分割され得る例えばC,O,G又はQ等の記号を現在 の文字イメージ内で見い出すように試みる(第15図のブロック1515)。こ の文字イメージを分割する後者の試みが失敗した場合、分離器348は本明細書 において後に述べられる更に別の独特の様式でもって分割され得るF、T又はE 等の記号を文字イメージ内で見い出すように試みる(第15図のブロック152 0)。
この一番最後の文字イメージを分割する試みが失敗した場合、分離器348はこ のイメージが分割され得る領域を文字イメージの頂部において見い出すことを試 みる(第15図のブロック1525)。この試みが失敗した場合、分離器348 はこの文字イメージをその頂部及び底部において同時に分割するように試みる( 第1512Nのブロック1530)。この後者の試みが失敗した場合、分離器3 48は本明細書において後に述べられる更に別の独特の様式でもって分割され得 るV又はW等の記号を文字イメージ内で見い出すように試みる(ブロック153 5)。
この最後の文字イメージを分割する試みが失敗した場合、分離器348は本明細 書において後に詳細に述べられる更に別の独得の様式でもって分割され得る00 等の記号パターンを文字イメージ内で見い出すように試みる(ブロック1540 )。
この後者の文字イメージを分割する試みが失敗した場合、分離器348は、本明 細書において後に述べられる更に別の独特の様式でもって分割を可能にする記号 Fを文字イメージ内で見い出すように試みる(第151mのブロック1545) 。
この究極の文字イメージを分割する試みがまた失敗した場合、分離器348は、 本明細書において後に述べられる対応の独特の様式でもって文字イメージを分割 することのできる1組のその他の特殊条件をイメージ内で見い出すように試みる (第15図のブロック1550)、この最終的な試みが失敗した場合、分離器は この文字イメージを分割することができない(第15図のブロック1555)。
第15図のブロック1510.1515.1520.1525.1530.15 35.1540.1545及び1550に相当する詳細なオペレーションが第1 6図、17図、18図、19図、20図、21図、22図、23図及び24図を 参照して本明細書に後にそれぞれ述べられる。
ここで第15図に戻って、上で言及されたブロック1510乃至1550の分割 プロセスの任意の1つが実際に文字イメージの分割に成功した場合、元のイメー ジから一対の分割イメージが発生される。この分割イメージの構造は第25図に 参照して下に述べられる。この結果得られる分割イメージは神経網330による 処理のために一度に1つずつ文字正常化器320の入力にフィードバックされる (第15図のブロック1565)、この1対の分割文字イメージから神経網33 0によって発生される結果は接触文字分離器348がそれが偶然に「良」記号を 分割していないことを確認する検査分割オペレーション(第15図のブロック1 570)において分析される。ブロック1570の「検査分割」オペレーション は第26図及び27図に言及して本明細書に後に詳細に述べられる。
推摺プ旦皇1丈 第3図に関連して上で述べられたように、腕節器346と接触文字分離器348 が両方共現在の文字イメージを2つのイメージに分割できない場合、文字イメー ジは推測プロセッサ350に送られる。この時点において、神経m330によっ てなされた記号選択の見かけ上の不信転性(低い得点によって示されている)が 飾り付けられたあるいは接触している文字の分離に失敗したことに因るという仮 定は不要になる。その代わり、システムはここで、神経網の記号選択の見かけの 不信転性が単に、正しい記号を取得することができなかったことに因ると仮定し 、更に正しい記号が実際は低得点選択の記号であると仮定する。推測プロセッサ 350は神経網330によってなされた第1、第2及び第3高得点記号選択を調 査し、第1選択を低得点記号選択の1つと置き換える論理的根拠を見い出すこと を試みる。そのオペレーションは第28図のフローダイアグラムに参照して詳細 に述べられる。
推測プロセッサ350は先ず、腕節器346と接触文字分離器348が両方共現 在の文字イメージを分割することを試みたかを決定する。そうである場合、推測 プロセッサ350は更に、神経網によって選択された最高得点記号の高さが元の (未正常化)文字イメージにおける連続「オン」画素の対象の実際の高さと一致 するか否かを決定する。(第28図のブロック2810)、これが不一致の場合 (ブロック2810のYES分岐)、神経網によって識別されたより低い得点の 記号選択の1つが実際は正しい選択であるという可能性が存在し、推測プロセン サ350はそれを見い出すように試みる。そうでない場合(ブロック2810の No分岐)、これらの高さが一致している場合、推測プロセッサ350は何も行 わない(第28図のブロック2815)、ブロック2810のYES分岐に沿っ て継続すると、推測プロセッサ350は次に、神経網330によって識別された 第2及び第3高得点記号選択の両方の高さが元の文字イメージにおける対象の実 際の高さと一致しているか否かを決定する(第28図のブロック2820)。
そうでない場合(ブロック2820のNo分岐)、推測プロセッサ350は、神 経*330によって識別された第2又は第3記号選択の一方が元の文字イメージ における対象の高さと一致するか否かを決定する(第28図のブロック2825 )。
そうである場合(ブロック2825のYES分岐)、推測プロセッサは、元の文 字イメージの高さと一致する高さを有するより低い得点の記号選択を識別する( 第28図のブロック2830)。そうでない場合(ブロック2825のNo分岐 )、推測プロセッサ350は第29図のルックアップテーブルを検査して、元の 文字イメージと関連する記号と一致する高さを有するどの記号が神経網によって 識別される最高得点記号と混同される可能性が一番高いかを、神経網が訓練され た記号組における記号の全てから決定する(第28図のブロック2835)。
このようにして見い出された記号は、推測プロセッサ350によって文字イメー ジにより表わされる記号として識別される。再びブロック2820について説明 すると、神経m330によって識別された第2及び第3最高得点記号選択が両方 共元の文字イメージに関連する高さと一致する高さを有する場合(ブロック28 20のYES分岐)、推測プロセッサ350は第29図のルックアップテーブル に参照して、これら2つのうちどれが神経IM330によって識別された最高得 点記号選択と一番混同され易いかを決定する(第28図のブロック2840)。
この「勝者」は推測プロセッサ350によって現在の文字イメージに対する正し い記号として識別される。
推測プロセッサ350はC言語コンピュータプログラムによって実施された。
−の牙 なi″B 第15図の9個の連続接触文字分離オペレーション1510乃至1550の各々 の1つをここで詳細にの述べることにする。本発明の好ましい実施例において、 各文字イメージは12X24画素正常化イメージの288個の二進法画素を表わ す288ビツトを含む二進法文字イメージワードとして第3図のシステムを進行 する。第30図に示されているように、未正常化文字イメージにおける連続7オ ン」画素の対象の高さ及び幅、文字イメージにおける連続「オン」画素の対象の 垂直及び水平位置、文字イメージの12列の各々における行程(未接続「オン」 画素)の数、各列における強度(「オン」画素の数)、12列の各々の1つにお ける最高及び最低「オン」画素C上列及び下列のそれぞれ)の高さ及び全ての列 の最高及び最低「オン」画素の現在の列イメージ(それぞれ最上及び最下)への 高さを含む基準パラメータユニッ)310によって計算される文字基準パラメー タを表わす付加的なバイトが付記されている。加うるに、それぞれ飾りひげフラ グ及び分離フラグを表わす2つのビットが付記されている6両方のフラグ共初期 はゼロに設定される。腕節器346はそれがワードを受けると必ず飾りひげフラ グを1に設定する。接触文字分離器348は、それが文字イメージワードを受け この文字を分割することが不可能である時は必ず分離フラグを1に設定する。最 後の2つのビットの例外はあるが、前記のパラメータは接触文字分離器348に よって達成される以下の9個のプロセスの種々のプロセスに用いられる。
底部分前ズ三皇凶 第15図の接触文字分離オペレーションは第16図に示されている底部分割プロ セス1510から始まる。このプロセスは、C言語プログラムの〜セクシヨンに よって実施される。第16図の底部分割プロセスは(その定位が第3図の基準パ ラメータユニット310によって前に確立されている)イメージのベースライン を探索することによりブロック1610から始まる。ブロック161Oの探索の 目的は、連続「オン」画素の対象における極薄点(最短列高さ)を見い出すこと である。斯かる対象は、数r3.にベースラインに沿って結合された数「2」で あり得る。斯くして、ブロック1610の探索は、イメージのベースラインに始 まる連続「オン」画素の最短垂直列を見い出すように試みる(第7図に定義され ているように)。このように定義された点における厚さが特定のしきい値を下回 るかについての決定がなされる(第16図のブロック1615)。そうでない場 合(ブロック1615のNo分岐)、第16図の底部分割プロセスは、「失敗」 し〔ブロック1620)、第15図の接触文字分離オペレーションは次の文字分 割プロセス(即ち、ブロック1515の分割C0GQ)に至る。しかしながら、 第16図のブロック1615の決定が、厚さがしきい値を上回ることを見い出し た場合(ブロック1615のYES分岐)、第16図の底部分割プロセスはその 次の段階に至り、この段階は、文字イメージが大文字「L」でないことを確認す る(第16図のブロック1625)。この段階は、文字vL」を垂直の棒及び水 平の棒に分割するのを避けるのに必要である0本質的に、ブロック1625の段 階はベースラインの高さから上昇ラインの高さく第7図に定義されているように )まで延びている垂直ライン及び垂直の棒からベースラインに沿って右に延びて いる水平の棒の存在を探す。分割されるべき文字が文字「L」であると決定され た場合(ブロック1625のALARM分岐)、この底部分割プロセスは失敗し くブロック1620)、第15図の接触文字分離プロセスは次の分割プロセスに 至る。そうでない場合、文字イメージがr(−、でない場合(ブロック1625 のOK分岐)、第16図の底部分割プロセスは次の段階に進み、この段階は分割 されるべき文字イメージが■、WあるいはYでないことを確認する(第16図の ブロック1630)。本質的に、ブロック1630の段階はその高さが単調に変 化し且つ互いの方向に延びてベースラインで合致する反対の方向に傾斜している 対角線の対を探す、ブロック1630の段階が、文字イメージが■、W又はYで あると決定した場合(ブロック1630のALARM分岐)、第16図の底部分 割プロセスは失敗しくブロック1620L第15図の接触文字分離プロセスは次 の段階に進む。そうでない場合(ブロック1630のOK分岐)、文字イメージ はv、W又はYのどれでもないと見い出され、第16図の底部分割プロセスは継 続する。この段階は、文字イメージが「J」あるいは「U」又は「u」でないこ とを確認するためである(ブロック1635)。本質的に、この段階はその両端 が上に延び且つベースラインから文字イメージの中間ラインに延びている垂直線 に接続している文字イメージのヘースライン近くの水平の円弧、即ち文字「u」 に対応する円弧を探す、この段階はまた、その両端が上に延びている水平円弧及 びその円弧の右端から上に延びている垂直ライン、即ち文字Jに対応するものを 探す1文字イメージがrJ、、「Uノ又はr u Jであると見い出された場合 (ブロック1635のALARM分岐)、第16図の底部分割プロセスは停止し くブロック1620)−第15図の接触文字分離オペレーションは次の分割プロ セスに進む、そうでない場合(ブロック1635のOK分岐)、ブロック161 0の段階において前に識別された1点は有効であると考えられ、第16図の底部 分割プロセスは新しい箱を構成する段階を始める(第16図のブロック1640 )。
ブロック1560の新i構成プロセスは、第25図に言及して以下により詳細に 述べられるように、この有効分割点を分割イメージ対の間の境界として用いて、 元の文字イメージから一対の分割イメージを生成する。この新箱構成プロセスは プログラムの一セクションにおいて実施される。この後、第15図の接触文字分 離プロセスはブロック1510の5UCCEED分岐をとり、前に述べたような 様式で継続する。
COG vプロセス 前記の底部分割プロセスが失敗した場合、第15図の接触文字分離プロセスに対 する次の段階にはブロック1515のC0GQプロセスである。このCoGQ分 割プロセスは第17図に示されている。第17図について説明すると、CoGQ 分割プロセスは円の左半分に略相当する円弧を探索する段階から始まる。(第1 7図のブロック1710)、ブロック1710の段階はこのプログラムの1セク シヨンにおいて実施される。斯かる円弧が見い出されない場合(ブロック171 0のNOT FOUND分岐)、第17図のCoGQ分割プロセスは放棄され、 第15図の接触文字分離オペレーションは次の分割プロセスに進む(第15図の ブロック1515のFAIL分岐)、ここで第17図に戻ると、斯かる円弧が見 い出された場合(ブロック1710のFOUND分岐)、次の段階は、文字イメ ージが文字「d」又は「q」であるかを決定することである(第17図のブロッ ク1720)、ブロック1720の段階はこのプログラムの1セクシヨンによっ て実施される。本質的に、ブロック1720の段階は円弧の上又は下の高さが円 弧、の高さに対する所定の比を超える円弧の右側に接触する垂直棒を見い出すよ うに試みる。「d」又は’qJが存在する場合(ブロック1720のTRUE分 岐)、第17図のCoGQ分割プロセスは停止し、第15図の接触文字分離オペ レーションはブロック1515のFAIL分岐をとり、次の文字分割プロセスに 進む。
これは、有効文字「d」又は「q」を分割するのを避けるために必要である。そ うでない場合(ブロック1720のFALSE分岐)、第17図のCoGQ分割 プロセスにおける次の段階は、円弧の右手境界を見い出すことである(第17図 のブロック1725)、ブロック1725の段階はプログラムの1セクシヨンに おいて実施される0本質的に、ブロック1725のステップは先ず、円弧におけ る各画素列を交差する行程の数が1つ又は2つのどちらかである故にこの文字が C(又はO)であるか否かを決定する。これが真であると見い出された場合、円 弧の右手境界は列当りの行程の数が1つ又は少なくとも3つに変化する右への第 1点であると考えられる。そうでない場合、ブロック1725の段階は、円弧に おける画素列を交差する行程の数が1から3まで全般的に変化する故にこの文字 がG(又はQ)に似ているかを決定する。後者の条件が真であると見い出された 場合、円弧の右手境界は、列高さにおいて鋭い垂直の降下又は立ち上がりが存在 する右への第1点であると考えられる。斯かる境界が見い出されない場合あるい は円弧において任意の列に4つ以上の行程が存在する場合(ブロック1725の NOT FOUND分岐)、コノ文字ハc、 O,G又はQであり得ず、第15 図の接触文字分離オペレーションはブロック1515のFAIL分岐をとり、次 の分割プロセスに進む、そうでない場合、右手境界が円弧に対して見い出された 場合(ブロック1725のFOUND分岐)、次の段階は現在の文字イメージを 円弧の右手境界において分割することにより形成される一対のイメージを画定す る新しい箱を構成することである。(第17図のブロック1730)。ブロック 1730の折箱構成段階はこのプログラムの1セクシヨンによって達成される。
この段階は上で論じられた第16図の新WJ構成段PJ1640に相当する。第 15図の接触文字分離プロセスはブロック1515のCoGQ分割段階を停止し 、ブロック1515の5(JCCEED分岐をとって前に述べられたブロック1 565に至る。
L工旦芳副1旦土ス 前記のCoGQ分割プロセスが文字イメージを分割することができない場合、第 15図の接触文字分離オペレーションにおける次の段階はブロック1520のF TE分割プロセスである。このプロセスはここで第18図に言及して詳細に述べ られる。ここで第18図について説明すると、第1段階(第18図のブロック1 810)は、上昇ライン高さにおいて平担な頂部−又は水平ラインが文字イメー ジに存在するかを決定することである。(第7圀に提起したように)。この段階 は、このプログラムの1セクシヨンにおいて実施される。平坦な頂部が見い出さ れない場合(ブロック1sioのNo分岐)、FTE分割プロセスが終了し、第 15図の接触文字分離プロセスはブロック152oのFAIL分岐をとり、次の 文字分割プロセスに至る。そうでない場合、平坦な頂部が存在しくブロック18 10のFOUND分岐)、次の段階は、ベースラインから平坦な頂部に上に延び ている2つの垂直ラインが存在する(第18図のブロック1820)−例えば、 大文字「M」に接触する大文字「I」に相当する条件かを決定することである。
そうである場合(ブロックエ820のYES分岐)、次の段階は、2つの列の間 を見て列底部定位の底部に急激な立ち上がり一例えば、それらの頂部のみにおい て結合しているI及びMに相当する条件を探すことである。斯がる条件が見い出 される場合(ブロック183oのFOUND分岐)、急激な立ち上がりを有する 列はイメージが分割されるべき境界であると考えられる(第18図のブロック1 840)、斯かる立ち上がりが見い出されない場合(ブロック185oのNOT  FOUND分岐)、2つの列の間の中間点はイメージが分割されるべき垂直境 界を画定する(ブロック1850)、ブロック182o、183o、184゜及 び1850の段階はこのプログラムの1セクシヨンにおいて実施される。2つの 垂直列が平坦な頂部の下に見い出されない場合(ブロック182oのNo分岐) 、この文字はF、T又はEの可能性が最も高い0次の段階は、右の方を見て平坦 な頂部の境界を探すことである(ブロック1860)、ブロック186oの段階 はこのプログラムの1セクシヨンにおいて実施される。本質的に、ブロック18 6oのの段階は、平坦な頂部を含む上昇ライン高さく第7図)に沿って延びてい るラインにおける僅かな下降又は谷点のどちらか−例えば、頂部において文字T に隣接している文字Fに相当する条件を探す、この段階はまた、列高さにおいて 右への急激な下降−右方で小文字0に隣接する文字Fに相当する条件を探す。下 降又は急激な下降のどちらかが斯くして定位されると必ず、次の段階、例えば、 この定位におけるイメージを分割しても大文字Iの右側に隣接している有効Xは 分割されずまた大文字■の右側に隣接している■も分割されないことを確認する ことである。ブロック1870の段階はこのプログラムのセクションにおいて実 施される。本質的に、ブロック1870の段階はブロック1860の段階によっ て検出された下降の上及び下の両方のスペースが空(「オン」画素が欠けた)で ある場合にIXパターンを検出する。ブロック1870の段階はブロック186 00段階によって検出された列高さにおける下降が中間ライン高さく第7図)の 下に延び且つ下降の上のスペースが空である場合にTVXパターン検出する。、 1χ又はIVパターンが検出された場合〔ブロック1870のFOUND分岐) 、第18図のFTE分割プロセスは失敗し、第15図の接触文字分離オペレーシ ョンはブロック1520のFAIL分岐をとり次のプロセスに至る。そうでない 場合(ブロック1870のOK分岐)、イメージはブロック1860の段階によ って識別された境界において分割される。イメージがブロック1840.185 0又は1870の段階の任意において分割されると必ず、次の段階はブロック1 880の折箱構成段階となる。この後者の段階はプログラムの1セクシヨンにお いて実施される。
頂商封ff工i玉 前記のFTE分割プロセスが文字イメージの分割に失敗すると、第15図の接触 文字分離プロセスはブロック1520のFAIL分岐をとり、ブロック1525 の頂部分割プロセスを開始する。この頂部分割プロセスはここで第19図に言及 して詳細に述べられる。これはこのプログラムのIセクションによって実施され る。
第1段階は、イメージの頂部における上昇ライン高さく第7図)に沿って対象に おける最弱点を探すことである(第19図のプロ7り2900)。この段階はこ のプログラムのセクションにおいて実施される。本質的に、この段階は上昇ライ ンに接触している「オン」画素の最短列を探し、この列の長さが所定量より少な いかを決定する。斯かる弱点が見い出されない場合(ブロック1900のNo分 岐)、第19図の頂部分割プロセスは失敗する。そうでない場合(ブロック19 00のFOUND分岐)、このように見い出された弱点は文字イメージを垂直に 分割するための可能定位であると考えられる。従って、このように定位された弱 点においてイメージを分割すると大文字「T」の頂部の水平棒の左側が切れるか の決定がなされる(ブロック1905)。ブロック1905の段階はこのプログ ラムの1セクシヨンにおいて実施される0本質的に、ブロック1905の段階は 文字イメージの頂部における水平ライン(第7図の上昇ライン高さ)及び特にブ ロック1900の段階において発見された弱点の左のこのラインの部分を探す、 ブロック1905の段階において、このラインのこの部分の下の領域が空(「オ ン」画素が欠けている)であるかについての決定がなされる。そうである場合( ブロック1905のYES分岐)、水平ラインは、文字「T」の頂部を横切るラ インの左側であると考えられ、従って上記で識別された弱点はイメージを分割す るのに用いられる。このプロセスは、ブロック1900の段階に戻ることにより 上昇ライン高さに沿って右の方に探索を続けて対象における弱点を探し続ける。
そうでない場合(ブロック1905のNo分岐)、次の段階は文字イメージにお ける隣接のセリフを探すことである(第19図のブロック1910)。ブロック 1910の段階はこのプログラムの1セクシヨンにおいて実施される。本質的に 、ブロック1910の段階は対象の頂部から下に短い距離に且つ中間ライン高さ く第7図)の上で終端している列を探す。隣接のセリフが見い出される場合(ブ ロック1910のFOUND分岐)、次の段階はこのセリフに隣接しているイメ ージにおける何らかの垂直棒を見い出すことである(第19図のブロック191 5)、次に、セリフの頂部からの距離が右の垂直棒までの方が左の垂直棒までよ りも大きいかの決定がなされる(第19図のブロック1920)、そうである場 合(ブロック1920のYES分岐)、この条件は例えばパターンITに相当し 、イメージはセリフのピークの左において分割される(ブロック1925) 、 そうでない場合(ブロック1920のNo分岐)、この条件は例えばパターンT Iに相当し、イメージはセリフのピークの右において分割される(ブロック19 30) 、ブロック1915.1920.1925及び1930の段階はこのプ ログラムの1セクシヨンにおいて実施される。ここでブロック1910の段階に 戻ると、隣接のセリフが見い出されなかった場合(ブロック1910のNoNE 分岐)、ブロック1900の段階において見い出された弱点は文字イメージを垂 直に分割する正しい点であり得る。しかしながら、次の段階は、パターンPT又 はP7が存在するかを決定し、そうである場合、T又は7の頂部の左側をPの右 まで分割するのを避けるように分割点を調節することである(ブロック1935 )、ブロック19350段階はこのプログラムの1セクシヨンにおいて実施され る0本質的に、ブロック】935のの段階はイメージの頂部における水平棒の底 部(第7図の上昇ライン高さ)に追従し、中間ライン高さ〔第7図)の下に延び ていない水平棒の底部の高さにおける下降を探す、任意の斯かる下降はPTパタ ーン又はP7パターンのどちらかにおける2つの記号の間の境界に相当する。ブ ロック1935の段階は斯かる場合における下降の左側への分割点を調節する0 次の段階は後尾セリフを探すことである(第19図のブロック1940)、ブロ ック1940の段階はこのプログラムの1セクシ5ンにおいて実施される。後尾 セリフはイメージの頂部(上昇ライン高さ)から下に延びて中間ライン高さの上 の高さまで至る提案された分割点の右への非常に短い垂直ラインである。後尾セ リフが見い出されない場合(ブロック1945のNo分岐)、イメージは提案さ れた定位において垂直に分割される。
そうでない場合、後尾セリフがこの点において見い出される場合(ブロック19 45のYES分岐)、頂部分割プロセスは失敗し、第15図の接触文字分離オペ レーションはブロック1525のFAIL分岐をとり次のプロセスに、即ちブロ ック1530の頂部及び底部分割プロセスに至る。第19図の頂部分割プロセス が文字イメージを分割すると必ず、ブロック1950の折箱構成段階を用いる。
この段階は、プログラムの1セクシヨンにおいて実施され、第16図のブロック 1640の折箱構成段階に相当する。
び プロセス 第15図のブロック1530の頂部及び底部分割プロセスが第20図に詳細に示 されており且つこのプログラムの1セクシヨンによって実施される。ブロック1 530の頂部及び底部分割プロセスは底部分割プロセス(ブロック1510)及 び頂部分割プロセス(ブロック1525)がイメージの底部及び頂部におし)で 未接続領域をそれぞれ見い出すのに失敗し、介入分割プロセスも失敗した場合に 有用である。第20図に示されている頂部及び底部分割プロセスの第1段階(ブ ロック2010)はそれを横切る2つの行程及び最小強度(「オン」画素の数) を有するイメージにおける垂直画素列を見い出すことである。この条件は、例え ば、その対向セリフが最小強度の垂直列の頂部及び底部において接続されてし) るパターンHr又はIHに相当する。この段階はこのプログラムの1セクシヨン において実施される。斯かる列が定位されない場合(プロ・ツク201OのN。
5PLIT分岐)、第20図の頂部及び底部分割プロセスが失敗し、第15図の 接触文字分離オペレーションはブロック1530のFA■L分岐をとり次の分割 プロセスに至る。そうでない場合、斯かる垂直画素列が見い出される場合(プロ ・7り2010のFOUND分岐)、第20図のプロセスにおける次の段階は、 列高さが急激に降下する点において垂直に分割され得るXa、Ia、Hx等の文 字パターンの存在を検査することである(ブロック2020)、この段階はこの プログラムの1セクシヨンにおいて実施される0本質的に、ブロック2020の 段階は段階2010において見い出される定位の左への垂直列高さにおける急激 な降下を探す、斯かる急激な降下が見い出される場合(ブロック2020のFO UND分岐)、イメージは降下の定位において垂直に分割される(ブロック20 30)。
斯かる降下が見い出されない場合(ブロック2020のNOT FOUND分岐 )。
次の段階(第20図のブロック2040)は、ブロック2010の段階において 識別される定位において先導文字を分割することを避けるために、POlOT、 O3等のイメージにおける文字パターンを探すことである。ブロック2040の 段階はこのプログラムの1セクシヨンにおいて実施される0本質的に、ブロック 2040の段階は上昇ラインの高さの下の列高さにおける谷点又は僅かな降下を 探す(第7図)。斯かる谷点が見い出される場合(ブロック2040のFOUN D分岐)、文字イメージは谷点において垂直に分割される(ブロック2050) 。そうでない場合(ブロック2040のNOT FOUND分岐)、文字イメー ジはブロック2010において識別された定位において垂直に分割される(ブロ ック2060)、第20図の頂部及び底部分割プロセスが(ブロック2030. 2050、又は2060の段階の任意によって)文字イメージを分割すると必ず 、次の段階はブロック2070の折箱構成段階である。ブロック2070の段階 はこのプログラムの1セクシヨンにおいて実施され、第16図のブロック164 0の折箱構成段階に相当する。
M光公割ブユ皇ス 第15図のブロック1530の頂部及び底部分割プロセスが失敗した場合、第1 5図の接触文字分離オペレーションはブロック1530のFAIt分岐をとり、 ブロック1535のVW分割プロセスに至る。ブロック1535の■W分割プロ セスが第21図に示されており、このプログラムの1セクンゴンにおいて実施さ れる。第21図のVW分割プロセスにおける第1の段階は、少なくとも中間ライ ン高さく第7図)から下に延びベースラインに至る列高さにおける谷点又は降下 を探すことである(ブロック2110)。斯かる谷点が見い出されない場合(ブ ロック2110(7)NOT FOUND分岐)、第21図のVW分割プロセス ハ失敗し、第15図の接触文字分離プロセスはブロック1535のFA■L分岐 をとり次のプロセスに至る。そうでない場合(ブロック2110のFOUND分 岐)、次の段階は、ブロック2110の段階によって識別された谷点が「■」形 であることを証明することである(第21図のブロック2120)。本質的に、 ブロック2120の段階はそのベースラインにおける幅が所定のしきい値を下回 り高さと共に単調に増加する場合この谷点がV形であることを決定する。この点 がV形でない場合、第21図のVW分割プロセスは失敗する(ブロック2120 のNo分岐)。ブロック2110及び2120の段階はこのプログラムの1セク シヨンにおいて実施される。この点がV形である場合(ブロック2120のYE S分岐)、次の段階(ブロック2130)は、ブロック2110の段階によって 定位される第1の点の右側への第2谷点を探すことである。この段階はブロック 2110の段階の様式と伯た様式でもって達成される。斯かる第2谷点が見い出 される場合(ブロック2130のFOUND分岐)、次の段階は、それがV形に 相当するかを決定することである。(ブロック2140)、ブロック2140の 段階はブロック2120の様式に似た様式でもって達成される。ブロック213 0及び2140の段階はこのプログラムの1セクンランによって達成される。第 2谷点がV形である場合(ブロック2140のYES分岐)、イメージの左側の 文字はWであると考えられ、従って第2谷から右に立ち上がる勾配の端部におい て分割される(ブロック2150)。そうでない場合、■形容が1つしかない場 合(ブロック2140のNo分岐)、イメージの左側の文字は■であると考えら れ、従って第1谷から右に立ち上がる勾配の端部において分割される(段階21 60)。ブロック2160の段階はこのプログラムの1セクシヨンにおいて実施 される。ブロック2130の段階が第2谷点を見い出せなかった場合同一の段階 が続く(ブロック2130のNOT FOUND分岐)、文字イメージがブロッ ク2150又は2160の段階のどちらかによって分割されると必ず、次の段階 はこのプログラムの1セクシヨンによって実施され且つ第16図のブロック16 40の折箱構成段階に相当するブロック2170の折箱構成段階である。
旦q分別ブ…皇玉 ■W分割プロセスが失敗した場合、第15図の接触文字分離オペレーションはブ ロック1535のFAIL分岐をとり、ブロック1540のOO分割プロセスを 開始する。00分割プロセスは第22図に示されており、このプログラムの1セ クシゴンにおいて実施される。この第1段階は、頂部から下に向けてその頂部に 向いている対象における小さな「v」形を探すことである(ブロック2210) 。
ブロック2210の段階はこのプログラムの1セクシヨンにおいて実施されるや 斯かる形状が見い出されない場合(ブロック2210のNOT FOUND分岐 )、第22図の00分割プロセスは失敗し、第15図の接触文字分離オペレーシ ョンはブロック1540のFAIt分岐をとって次のプロセスに至る。そうでな い場合、斯かるV形が見い出される場合(ブロック2210のFOUND分岐) 、次の段階はベースラインから上に向けて最初の小さなV形の頂点に向いている 小さな逆V形を探すことである(ブロック2220)、ブロック2220の段階 はこのプログラムの1セクシヨンによって実施される。斯かる逆V形が見い出さ れない場合(ブロック2220のNOT FOUND分岐)、第22図のOO分 割プロセスは失敗する。そうでない場合、互いの方向を向いている「正」及び「 逆」V形の存在はV形の頂点において分割され得る。0O1QC,OD、OP等 の文字パターンの存在に相当する(ブロック2230)、次の段階は分割された イメージに対して新しい箱を構成することである(ブロック2240)、ブロッ ク2240の段階はこのプログラムの1セクシヨンにおいて実施され、第16図 のブロック1640の折箱構成段階に相当する。
土工圀側ブ…皇λ 第15図の接触文字分離オペレーションはOo分割プロセスが失敗した場合ブロ ック1540のFAIL分岐をとり、ブロック1545の小f分割プロセスに至 る。/h f分割プロセスは第23図に示されており、このプログラムの1セク シヨンによって実施される。第1の段階は、小rの左側を検出することである( ブロック2310)、この段階はこのプログラムの1セクシゴンにおいて実施さ れる0本質的に、ブロック2310の段階は高い列であってそこから左方に延び ている中間ライン高さく第7図)のあたりにおける短い棒を有するイメージにお ける高い列を探す(ブロック2310)、斯かる特性が見い出されない場合(ブ ロック2310のNOT FOUND分岐)、第23図の小f分割プロセスは失 敗し、第15図の接触文字分離オペレーションはブロック1545のFAIL分 岐をとって次のプロセスに至る。そうでない場合、斯かる特性が見い出された場 合(ブロック231OのFOUND分岐)、次の段階は小fの頂部を検出するこ とである(第23図のブロック2320)、ブロック2320の段階はこのプロ グラムの1セクシヨンにおいて実施される。本質的に、ブロック2320の段階 はその2つの端部が下方に傾斜しており右に延び且つ上昇ライン(第7図)に接 しているブロック2310の段階において参照された垂直ラインの頂部における 小円弧を探す、この後者の特徴が見い出されない場合(ブロック2320のNo TFOUND分岐)、第23図の小f分割プロセスは失敗する。そうでない場合 (ブロック2320のFOUND分岐)、小文字fは見い出されたものと考えら れ、次の段階はこの小f右境界を見い出すことである(ブロック2330)、ブ ロック2330の段階はプログラムの1セクシヨンにおいて実施される。本質的 に、ブロック2330の段階はブロック2320の段階において検出された円弧 の右側への垂直降下あるいは円弧の下方に傾斜している右端部における上方傾斜 のどちらかを探す。垂直降下は例えば文字パターンfe又はfaに相当する。上 方傾斜は例えば文字パターンToに相当する。どちらの場合も、垂直降下又は上 方傾斜の初めは小fの右境界であると考えられる。しカルながら、この境界にお いてイメージを垂直に分割する前に、イメージのアスペクト比を検査しなければ ならない(プロ、り2340)。ブロック2340の段階はこのプログラムの1 セクシヨンにおいて実施される。イメージが十分に広くない場合(ブロック23 40のNo分岐)、同一のイメージ内の別の文字がその後に続く小文字fが存在 する可能性があり、第23図の小f分割プロセスは失敗する。そうでない場合( ブロック2340のOK分岐)、文字はブロック2330の段階によって定位さ れる境界において分割され、新しい分割イメージを定義する新しい箱が構成され る(ブロック2350)。ブロック2350の折箱構成段階はプログラムにおい て実施される。
椎分何 第15図のブロック1510乃至1545の文字分割プロセスの全てが失敗した 場合、イメージを分割するための残りの可能性はブロック1550の雑分割プロ セスによって探索される。ブロック1550の雑分割プロセスが第24図に示さ れており、このプログラムの1セクシヨンにおいて実施される。イメージは通常 の如く左から右に分析され(ブロック2400)、第1段階はイメージの頂部又 は中間における谷点を探すことである(ブロック2410)、斯かる谷点はパタ ーンbc又はoOにおける2つの文字の接合点に相当するであろう。ブロック2 410の段階はこのプログラムの1セクシヨンにおいて実施される0本質的に、 この段階は各列の頂部高さを監視し、幾つかの列にわたって列高さにおける僅か な立ち上がりがその後に続く僅かな降下を探す。斯かる特徴が見い出された場合 (ブロック2410のFOUND分岐)、次の段階は谷の底部においてイメージ を垂直に分割し、分割イメージのこの対に対して新しい箱を構成することである (第24図のブロック2420)、ブロック2420の段階はこのプログラムの 1セクシヨンにおいて実施される。しかしながら、斯かる特性が見い出されない 場合(ブロック241OのNOT FOUND分岐)、次の段階は列高さにおけ る急激な降下を探すことである(ブロック2430)、斯かる特性は、例えばパ ターンDeにおける隣接文字間の接合点に相当する。ブロック2430の段階は このプログラムの1セクシヨンにおいて実施される。この特性が見い出された場 合(ブロック2430のFOUND分岐)、次の段階は識別された点においてイ メージを垂直に分割し、この2つの分割イメージに対して新しい箱を構成するこ とである(ブロック2420)、そうでない場合(ブロック2430のNoTF OUND分岐)、次の段階は頂部列高さにおける緩やかな立ち上がりを探すこと である(ブロック2440)、この特性は、例えばパターンrtにおける2つの 隣接文字間の接合点に相当する。ブロック2440の段階はこのプログラムの1 セクシヨンにおいて実施される。斯かる特性が見い出された場合(ブロック24 40のFOUND分岐)、次の段階はこの様に識別された点においてイメージを 垂直に分割し、その結果得られた分割イメージに対して新しいイメージ箱を構成 することである(ブロック2420)。そうでない場合(ブロック2440のN OT FOUND分岐)、次の段階は列高さにおける2激な立ち上がりを探すこ とである(ブロック2450)。斯かる特性は例えばパターンg1又はkhにお ける隣接文字間の接合点に相当する。ブロック2450の段階はこのプログラム の1セクシヲンにおいて実施される。この特性が見い出された場合(ブロック2 450のFOUND分岐)、次の段階はブロック2420の折箱構成段階である 。そうでない場合(ブロック2450のNOT FOUND分岐)、次の段階は これらの列の底部の定位における急激な立ち上がりを探すことである(第24図 のブロック2460)。斯かる特性は例えばパターン9u又はgaにおける隣接 文字間の接合点に相当する。ブロック2460の段階はこのプログラムの1セク シヨンにおいて実施される。斯かる特性が見い出された場合(ブロック2460 のFOUND分岐)、次の段階はブロック2420の折箱構成段階である。そう でない場合(ブロック2460のNOT FOUND分岐)、この最後の段階が 失敗した場合、第24図の雑分割プロセスは失敗し、第15図の接触文字分離プ ロセスの全体の失敗を合図する(第15図のブロック1555)。
第15図のブロック1510乃至1550の各後続の分割プロセスにおける文字 イメージの前記の幾何学的特徴に関する照会はブロック1510乃至1550の プロセスの先行するプロセスの前の照会の結果にのみ鑑みた明白な意味を有する 。極端な例として、ブロック1550の雑分割プロセスにおいてなされた幾何学 的特性に関する照会は、恐らくブロック1510乃至1545の8個の先行する 文字分割プロセスの結果無しには有意な情報をもたらさないであろう。その必然 的結果は、前の8個のプロセス(ブロック1510乃至1545)による多数の 可能性の解消により先行のプロセスにおいて探索されない文字分割定位の雑可能 性の全てを探し出すためにブロック1550の最終プロセスにおいてなされなけ ればならない照会を大幅に簡略化することである。斯くして、第15図の接触文 字分離オペレーションを含む9個の文字分割プロセス(ブロック1510乃至1 545)の結果は、分離を受け易い隣接文字の全ての可能なパターンの論理的に 漸進的な解消であり、これによりブロック1550の雑分割プロセスによるその 他の場合の解消という結果をもたらす。
飯血導戊段旧 第16図乃至24図の9個のプロセスの各々は折箱構成段階で終る。この段階は 第25図に言及して詳細に述べられよう、第16図乃至24図の9個のプロセス のプログラムの9個のそれぞれのセクションにおける実施はプログラムの別のセ クションにおいて定義されるルーチンを呼ぶことにより折箱構成段階を達成する 。このルーチンは第25図のプロセスの実施であり、第16図乃至24図の9個 のプロセスの各々の1つにおける折箱構成段階によって達成される。第25図の 折箱構成プロセスは文字イメージが垂直に分割されるべき点の識別に応答しその 境界(「箱」〕が適切に定義されている新しい対のイメージを形成する。第25 図の折箱構成プロセスにおける第1段階は規定された点においてイメージを垂直 に分割することにより形成された対のイメージの各々の寸法を決定し、各折しい イメージの寸法が所定の最小しきい寸法より大きいことを確認することである( 第25図のブロック2510)。好ましい実施例において、この決定は新しいイ メージの各々の高さが元の分割イメージの幅の少なくとも35%であるか否かを 照会することによりなされる。このテストは文字Jがその中間から下が垂直に分 割されたかを検出する。ブロック2510の段階はこのプログラムの1セクシヨ ンにおいて実施される。両方の新しいイメージが標準にかなわない場合(ブロッ ク2510のNo分岐)、イメージはこの点において分割されず、第15図の接 触文字分離オペレーションは現在達成されている9個の文字分割プロセスのこの プロセスのFAIL分岐をとり次のプロセスを開始する。そうでない場合(ブロ ック2510YES分岐)、次の段階は元のイメージから分割された新しいイメ ージの対の各々の1つが垂直に連続していることを確認することである(第25 図のブロック2520)、ブロック2520の段階はこのプログラムの1セクシ ヨンにおいて実施される0本質的に、ブロック25200段階は、互いに接続さ れていないイメージの頂部及び底部に対象が存在しないことを確認する。この段 階は例えば文字Cのその中間の下の分割を検出する。2つの分割イメージにおけ る文字が連続しない場合(ブロック2520のNo分岐)、元のイメージは上記 で論じられたブロック2510のNo分岐の様式でもうてこの点において分割さ れない。そうでない場合(ブロック2520のYES分岐)、次の段階はイメー ジのベースラインから上昇ライン高さ即ち頂部まで全てにわたって延びていない 薄い対象が存在するかを決定することである(ブロック2530)。この段階は このプログラムの1セクシヨンにおいて実施される0本質的に、ブロック253 0の段階はその高さに対して相対的な分割イメージの対のどちらかにおける対象 の幅が文字rlJを示すようなものであるかを決定する。斯かる対象がイメージ の頂部(上昇ライン高さ)まで全てにわたって延びていないと見い出された場合 (ブロック2530のYES分岐)、元のイメージは、上記で論じられたブロッ ク2510のNo分岐の様式でもってこの点では分割されない、斯かる特性が見 い出されない場合(ブロック2530のNo分岐)、提案された分割点は正しい と考えられる。次の段階は、イメージを分割することにより形成された各分割イ メージの境界の近くの破片をきれいに取り去ることである。斯かる破片は例えば 、大文字Iのセリフの右端を小χを含む分割文字に取り入れるべく隣接文字パタ ーンlxが分割される時に形成され得る。斯かるまちがいの結果は、文字χとχ から大きなスペースでもって分離されたイメージの左端のχの上の小さな斑点を 含むイメージであろう、ブロック25400段階はこの小斑点を捨て、イメージ の頂部境界をそれがこの例において文字Xの頂部に隣接するまで下げることによ り空のスペースを解消する。斯かる空のスペースを解消するために、ブロック2 540の段階はイメージにおける空の行又は列を探す、ブロック25400段階 はこのプログラムの1セクシヨンにおいて実施される。次の段階は、元のイメー ジを分割することにより形成された折箱詰文字イメージを発生することである( ブロック2550)、ブロック2550の段階はこのプログラムの1セクシヨン において実施される。
分葱検査工旦皇込 第25図の折箱構成プロセスの完了の後、第15図の接触文字分離オペレーショ ンによって達成される次の段階は新しい対の分割イメージを1度に1つずつ神経 !1i1320にフィードバックしく第15図のブロック1565)、次に神経 網によって発生された結果を用いて、前に論しられたように、イメージが不適切 に分割されているかを決定することである〔第15図のブロック1570)、ブ ロック】570の分割検査プロセスは第26図に詳細に示されている。第26図 の分割検査プロセスの目的は第15図の9個の文字分割プロセスがどれも単一の 有効記号を2つの意味のない又は誤解に導く対象に分割しないように保護するこ とである。第15図の9個のプロセスの各々に構築された保護手段(ブロック1 51゜乃至1550)の全ては、元の文字イメージが実際2つの文字を含んでい ると仮定した。斯くして、実際に1つの文字しか含んでいない文字イメージの分 解から保護するためには付加的な保護手段が必要となる。この保護手段は、第2 6図に示されている第15図のブロック1570の分割検査プロセスによって提 供される。
第26図の分割検査プロセスは元の(未分割)文字イメージのアスペクト比が所 定の大きさより大きい(かなり広いイメージを示す)かを決定することによりブ ロック2600のブロックにおいて開始する。そうでない場合、イメージの分割 は有効であると考えられ(ブロック2600のYES分岐)、これ以上の検査は 達成されない。一般的に、所定のアスペクト比は、神経網が分割イメージの1つ をm又はWとして識別する場合は2. 1であり、そうでない場合は1.5であ る。 (好ましくは文字イメージが文字イメージに重なる3つの水平ラインの3 つの垂直交差を有する場合はこれは恐らく「m」であり、アスペクト比は2.1 に設定される。また、文字イメージの幅が頂部から底部まで連続的に減少すると 見い出される場合、この文字は恐らく「w」であり、アスペクト比は2.1に設 定される。)アスペクト比がこの大きさに達することができない場合(ブロック 2600のNo分岐)、次の段階は一般検査プロセスである(ブロック2610 )。
ブロック2610の一般検査プロセスにおいて、イメージのこの2つの新しいイ メージへの分割は、この2つの新しいイメージのどちらかに対して、神経網によ ってなされた最高及び第2最高得点記号選択の点の比が所定のしきい値より小さ い場合は拒否される。好ましい実施例では、このしきい値は50である。すると 、ブロック2610の一般的検査プロセスは元の(未分割)イメージに対して神 経網330によってなされた最高得点記号選択をそれが接触文字分離器348( 第3図)に送られる前に、元のイメージが第27図に示されている分割選択パタ ーンでもって分割される2つの新しいイメージに対して神経網320によってな された2つの記号選択と比較する。例えば、元のイメージが神経網によって文字 Uとして識別され、2つの分割イメージがここで神経網330によって例えばL 及びJとして識別される場合、第27図の分割選択パターンの1つとの一致が見 い出され、分割は拒否される。このプロセスは第15図の9個の分割プロセス( 即ちブロック1510乃至1550)の任意の1つによってなされ易い予想可能 な1組のまちがいが1つの記号を2つ以上の対象に分割することのないように保 護する。第27図の分割選択パターンの任意が識別される場合(ブロック261 0のFAIL分岐)、分割は拒否される。ブロック2610の一般的検査プロセ スはC言語プログラムにおいて実施される。
2つの分割イメージが一般的検査プロセスによって達成された前記のテストの全 てを合格した場合(ブロック2610のPASS分岐)、次の段階は第15図の ブロック1510乃至1550の9個のプロセスのどれが元のイメージが分割さ れた点を識別したかに応して、ブロック2620における9個の個別検査プロセ スの1つを達成することである。この9個の個別検査プロセスはブロック262 0内で1.2.3.4.5.6.7.8及び9のラヘルを付けられている。ブロ ック2610の一般的検査プロセスは第15図の全ての9個の分割プロセスに共 通な単一文字分割のまちがいから保護するが、ブロック2620の9個の個別検 査プロセスの目的は第15図の9個の分割プロセスの個別の1つに独特の単一文 字分割のまちがいから保護することである。ブロック2620の9個の個別検査 プロセスの1つの形がこのプログラムの1セクシヨンにおいて実施される。本質 的に、9個の個別検査プロセスの適用可能な1つは先ず分割イメージのどちらか がその点が第2最高得点記号選択より大きな最小因子より小さな神経網330( 第3図)によって成される記号選択を生成する任意の分割を拒否する。この因子 の大きさは、ブロック2620の9個の個別検査プロセスのどれが含まれるかに 依る。好ましい実施例において、この因子はブロック2620の検査プロセス1 乃至8に対しては50であり、第15図のブロック1550の雑分割プロセスに 割り当てられた個別検査プロセス9に対しては100である。イメージ対の分割 がこのテストを通過すると仮定すると、ブロック2620(D個別検査プロセス l乃至9の各々の1つにおける次の段階は第27図に示されているプロセスに類 似している。詳細には、元の(未分割)イメージに対して神経網330によって 前になされた記号選択及び元のイメージから分割されたイメージの対に対して神 経網330によってここでなされた2つの記号選択は第27図の表と類似の分割 記号選択の9個の表の1つに3つの要員組として比較されると考えられる。これ らの表の各1つはブロック2620の9個の個別検査プロセスの対応する1つに 対して独特であり、第15図のブロック1575の表1乃至9として考えられ得 る。
好ましい実施例における各表の内容はブロック262oに属するプログラムのセ クションから容易に推論し得るが、この9個の表の各1つの内容が以下に発生す るかを説明する方が有用である。第15図について説明すると、表1は分割プロ セスの第1のプロセス、卯ちブロック151oの底部分割プロセスに割り当てら れた個別検査プロセスに関連している。表1の内容は、各文字のイメージを完全 な文字の形で100回程多く入力し、文字イメージがブロック151oの底部分 割プロセスによって分割された時は必ず神経網の出力を観察(ブロックl 56 5)することにより発生する、このように観察された優勢な分割選択は表1にマ ツプされる。例えば、ブロック1510の底部分割プロセスが文字Aを神経網に よって識別された一対の記号にP及び7として100回の内50回分割する場合 、P及び7にマツプされたAは表1に記録されたパターンである。第15図の9 個のプロセスの全てに対して同一のルーチンがとられ、それらの観測された分割 記号選択は記号組の全体が1度に1つの記号ずつ試験される時に9個の個別表の 対応する1つに記録される。
実際のオペレーションの期間中、元のイメージ及び分割イメージによって生成さ れた分割記号選択パターンはブロック262oの9個の個別検査プロセスの対応 する1つによって呼ばれた実際の表の内容と比較される。一致が見い出された場 合(ブロック2630のYES分岐)、分割が拒否される。そうでない場合(ブ ロック2630のNo分岐)、分割は有効であると考えられる。
利点及だ工呈的庭里性 本発明は媒体上の印刷された書類又は機械印刷された文字を読み出すための光学 的文字認識システムとして有用である。
θθ勿1ツ1 特表千5−506114 (1B) G G;、(D rRJ\ 請1分升 誘羞分麺 誤是分饅 誤差分頻 ゛ ・ 4n−システム 要約書 所定組の記号を認識するように訓練された神経網に送られるようになっているさ れる。後置プロセッサは神経網によってなされた誤りの記号識別を補正する。
後置プロセッサは文字正常化に続いて神経網によって識別可能でない特殊記号及 び記号ケースを識別する。低得点でもって神経網によって識別された文字に対し ては、後置プロセッサは飾り付けられた隣接文字及び接触している文字を見い出 に基づいて神経網によって識別される第2又は第3最高得点記号のどちらかを選 択する。
手続補正書風 1、事件の表示 PCT/US91100651 平成 3年特許願第504481号 2、発明の名称 機械印刷文字用光学的文字認識神経網システム3、補正をする者 事件との関係 特許出願人 住所 名称 イーストマン・コダック・カンパニー4、代理人 住 所 東京都千代田区大手町二丁目2番1号新大手町ビル 206区 電 話 3270−6641〜6646国際調査報告

Claims (1)

  1. 【特許請求の範囲】 1.光学的文字認識システムにおいて、所定の組の記号を認識するように訓練さ れ且つ入力及び出力であって上記入力に転送された各文字イメージが上記組にお ける上記記号の各々の1つに対する個別の得点を与えられる入力及び出力を有す る神経網、上記神経網に結合され且つ書類イメージにおける複数の連続「オン」 画素を別々の対象と呼び且つ上記書類イメージからの上記対象を個別文字イメー ジとして分割するための手段を含む前置プロセッサ、上記神経網出力に結合され 且つ上記神経網の出力に応答する手段であって所定の組の神経網出力条件の少な くとも1つに合致し上記神経網の出力を直すための手段を含む後置プロセッサ を特徴とする光学的文字認識システム。 2.上記前置プロセッサが、上記文字イメージの元の形を正常化するための且つ 上記文字イメージの正常化された形を上記神経網入力に転送するための手段を更 に特徴とする請求項1のシステム。 3.上記所定組の神経網出力条件が、上記神経網出力における最高得点が上記前 置プロセッサによって正常化された時のその文字イメージが上記神経網によって 他の記号から区別不可能である所定組の記号の1つに相当する条件を含むことを 特徴とする請求項2のシステム。 4.上記他の記号が上記1つの記号の上及び下ケース形の1つであり且つ上記補 正手段が、上記文字イメージの上記元の形の寸法から上記記号の上及び下ケース 形のどちらが上記文字イメージによって表わされるかを決定するための手段によ って更に特徴付けられていることを特徴とする請求項3のシステム。 5.上記所定組の神経網出力条件が、上記出力における最高得点が不十分に高い という条件を含んでおり、上記補正手段が、上記文字イメージの元の形がその正 常化された文字イメージがそこから区別不可能な上記所定記号組に含まれていな い1組の特殊記号に相当する所定の小寸法より小さいか否かを検出するための手 段、及び上記文字イメージから上記文字イメージによって表わされる上記特殊記 号の1つの識別を決定するための手段 を特徴とすることを特徴とする請求項2のシステム。 6.上記前置プロセッサが飾り付けられている上記書類イメージにおける隣接記 号のイメージを分離することを特徴とする請求項1の光学的文字認識システム。 7.上記呼称手段が、上記書類イメージの前に走査された部分における2つの別 々に呼称された対象が上記イメージの別の後に走査された部分において結合され ると必ず応答してこれにより上記2つの対象を1つのより大きな対象として呼称 し且つ上記2つの対象の各々の寸法を覚え、上記呼称手段は更に、唯1つのより 大きな対象として呼称された複数の対象の1つが所定しきい値寸法より大きな寸 法を有すると必ず応答して、これにより上記より大きな対象から上記1つの対象 を分離し、これにより上記書類イメージにおける接触文字を分離することを特徴 とする請求項6の光学的文字認識システム。 8.上記所定しきい値寸法が上記書類イメージにおける記号の平均寸法の当りで あることを特徴とする請求項7のシステム。 9.光学的文字認識システムにおいて、所定組の記号を認識するように訓練され 且つ入力及び出力であって上記入力に転送された各イメージに上記組における上 記記号の各々の1つのための個別の得点が与えられる入力及び出力を有する神経 網、上記神経網に接続され且つ書類イメージから個別文字イメージを分割するた めの分割手段及び上記文字イメージの元の形から上記文字イメージの正常化され た形を発生するための正常化手段を含む前置プロセッサ、上記神経網出力に且つ 上記正常化手段の入力に接続され且つ上記神経網出力における最高得点が複数の 漸進的により時間消費的な試みの継続を達成するのに不十分である時は必ず応答 して上記不十分な点に相当する選択より信頼性の高い記号選択を推論する手段を 含む後置プロセッサを特徴とする光学的文字認識システム。 10.上記後置プロセッサが、 その正常化された文字イメージが別の記号のイメージに対して曖昧である記号を 上記文字イメージにおいて識別することにより上記試みの最初の1つを達成する ための正常化補償プロセッサ手段、及び上記曖昧さ正常化プロセッサが上記文字 イメージを首尾良く識別できない時は必ず、上記文字イメージにおいて共に飾り 付けられている2つの記号のイメージを分離することにより上記試みの第2の1 つを達成するための脱飾プロセッサ手段を更に特徴とする請求項9のシステム。 11.上記後置プロセッサが、 上記脱飾プロセッサ手段が上記文字イメージを首尾良く分離することができない 時は必ず、上記文字イメージにおける互いに接触している2つの記号のイメージ を分離することにより上記試みの第3の1つを達成するための接触文字プロセッ サ手段 を更に特徴とすることを特徴とする請求項10のシステム。 12.推測プロセッサ手段であって、 (1)幾つかの低得点記号のどれが上記文字イメージの上記元の形の高さに一番 近い高さを有するか、 (2)上記の幾つかの低得点記号の全てが上記文字イメージに高さの点で近いと 必ず、上記神経網出力において識別された上記低得点記号のどれが最高得点記号 に上記神経網によって混同される可能性が一番高いかの1つに応じて、最高得点 記号の代わりに上記神経網の出力において識別された幾つかの低得点記号の1つ を選択するための推測プロセッサ手段を更に特徴とすることを特徴とする請求項 11のシステム。 13.上記正常化プロセッサ手段が上記神経網出力において識別された最高得点 記号がその正常化された文字イメージが上記記号の上及び下ケース形に対して同 じである記号である時は必ず上記元の文字イメージから上記文字イメージのケー スを識別するためのケース補正手段を特徴とすることを特徴とする請求項10の システム。 14.上記前置プロセッサの上記分割手段は上記書類イメージにおける「オン」 画素を度数分布し上記書類イメージを「オン」画素が欠けたその中の画素の行及 び列に沿って分割することにより上記文字イメージを分離し、且つ上記脱飾プロ セッサ手段が上記文字イメージに対して接続成分分析を達成することにより上記 文字イメージにおける飾り付けられた記号を分離することを特徴とする請求項1 0のシステム。 15.上記接触文字プロセッサ手段が一連の文字分離試行プロセスを所定の順序 で達成するための手段であって、上記試行プロセスの各々が上記プロセスの次の プロセスにおいて不在であると仮定されている対応の組の可能な接触記号対を探 索する手段によって特徴付けられることを特徴とする請求項11のシステム。 16.上記接触文字プロセッサ手段が、(1)上記文字イメージを2つの隣接記 号の底部において分離することを試み、(2)左手円弧を有する記号を隣接記号 から分離するように試み、(3)頂部水平ラインを有する記号を隣接記号から分 離するように試み、(4)上記文字イメージを2つの隣接記号の頂部において分 離するように試み、(5)上記文字イメージをその頂部及びその底部の両方にお いて分離することを試み、 (6)互いに反対に傾斜している対角線を含む記号を隣接記号から分離するよう に試み、 (7)隣接円弧を有する一対の記号を分離するように試み、(8)小文字fを隣 接記号から分離するように試み、及び(9)上記の(1)乃至(8)において試 みられなかった隣接記号を分離することを試みる ための手段によって特徴付けられることを特徴とする請求項14のシステム。 17.上記脱飾プロセッサ手段及び上記接触文字分離プロセッサ手段が各々、上 記正常化プロセッサに上記文字イメージを分離することにより形成された一対の イメージを転送するための手段を含むことを特徴とする請求項11のシステム。 18.上記接触文字プロセッサは、 上記神経網出力に第2パターンを得るべく上記正常化プロセッサに上記文字イメ ージを分離することにより形成された一対のイメージを転送するための手段、及 び 上記神経網の上記出力における上記第2パターンを単一の既知記号の文字イメー ジを分割する上記一連の試行プロセスの対応の1つに典型的な所定の出力パター ンと比較するための誤差検査手段 を更に特徴とすることを特徴とする請求項15のシステム。 19.上記所定出力パターンが、上記試行プロセスの対応の1つによって分離さ れた単一記号の連続イメージを上記神経網入力に転送することにより確立された 1組の所定出力パターンの1つであることを特徴とする請求項18のシステム。 20.上記接触文字プロセッサが、1組の既知一般誤差パターンと、(a)上記 文字イメージに対して上記神経網によって識別された最高得点記号及び(b)上 記文字イメージを分離することにより形成された上記対のイメージに対して上記 神経網によって識別された記号を含むパターンを比較するための一般的検査手段 によって更に特徴付けられることを特徴とする請求項18のシステム。 21.上記組の既知一般的誤差パターンが既知シンボルの2つの部分への分割に 相当することを特徴とする請求項20のシステム。 22.所定組の記号を認識するように訓練され且つ入力及び出力であって上記入 力に転送された名文字イメージに上記組における上記記号の各々の1つに対して 個別得点が与えられる入力及び出力を有する神経網を含む光学的文字認識システ ムにおける、光学的文字認識を達成するための方法であって、書類イメージにお ける複数の連続「オン」画素を別々の対象として呼称し且つ上記書類イメージか らの上記対象を個別文字イメージとして分割することを更に特徴とする前置処理 段階、 上記神経網の出力が所定の組の神経網出力条件の少なくとも1つに合致した時は 必ず検知し、上記検知手段に応答して上記神経網の出力を補正することを更に特 徴とする後置処理段階 を特徴とする方法。 23.上記前置処理段階が、上記文字イメージの元の形を正常化し、上記文字イ メージの正常化された形を上記神経網入力に転送することを更に特徴とする請求 項22の方法。 24.上記所定組の神経網出力条件が、上記神経網出力における最高得点が上記 前置プロセッサによって正常化されている時のその文字イメージが他の記号から 上記神経網によって区別不可能である所定組の記号の1つに相当するという条件 を含むことを特徴とする請求項23の方法。 25.上記他の記号が上記一方の記号の上及び下ケース形の一方であり且つ上記 補正段階が上記記号の上記上及び下ケース形のどれが上記文字イメージによって 表わされるかを上記文字イメージの上記元の形の寸法から決定することを含むこ とを特徴とする請求項24の方法。 26.上記所定組の神経網出力条件が上記出力における最高得点が不十分に高い という条件を含んでおり、上記補正段階が、上記文字イメージの元の形がその正 常化文字イメージがそこから区別不可能である上記所定記号に含まれていない1 組の特殊記号に相当する所定の小寸法より小さいかを検出すること、及び 上記文字イメージによって表わされる上記特殊記号の1つの識別を上記文字イメ ージから決定すること に特徴付けられることを特徴とする請求項23の方法。 27.上記前置処理段階が飾り付けられている上記書類イメージにおける隣接記 号のイメージを分離することを更に特徴とすることを特徴とする請求項22の方 法。 28.上記呼称段階が、 上記書類イメージの前に走査された部分における2つの別々に呼称された対象が 上記イメージの別の後に走査された部分において結合される時の第1の検知、上 記第1検知段階に応答して上記2つの対象を1つのより大きな対象として呼称す ること、 上記2つの対象の各々の寸法を覚えること、1つのより大きな対象として呼称さ れている複数の対象の1つが所定しきい寸法より大きな寸法を有する時の第2の 検知、及び上記第2検知段階に応答して上記より大きな対象から上記1つの対象 を分離してこれにより上記書類イメージにおいて接触文字を分離することを更に 特徴とすることを特徴とする請求項27の方法。 29.上記所定しきい寸法が上記書類イメージにおける記号の平均寸法の当りで あることを特徴とする請求項28の方法。 30.所定組の記号を認識するように訓練され且つ入力及び出力であって上記入 力に転送された各イメージに上記組における上記記号の各々の1つのための個別 の得点が与えられる入力及び出力を有する神経網を特徴とする光学的文字認識シ ステムにおける、光学文字認識を達成するための方法であって、個別文字イメー ジを書類イメージから分割し且つ上記文字イメージの正常化された形を上記文字 イメージの元の形から発生し且つ上記正常化さた形を上記神経網の上記入力に転 送することを含む前置処理段階、上記神経網出力における最高点が不十分である 時は必ず検知することを含む後置処理段階、及び 上記検知段階に応答して上記不十分な点に対応する選択より信頼性の高い記号選 択を推論するために複数の漸次により時間消費的な試みの継続を達成する段階を 含むことを特徴とする方法。 31.上記後置処理段階の上記達成段階が、その正常化された文字イメージが別 の記号のイメージに対して曖昧である記号を上記文字イメージにおいて識別する ことにより上記試みの第1の試みを達成すること、及び 上記第1の試みが上記文字イメージを首尾良く識別することに失敗した時は必ず 上記文字イメージにおいて共に飾り付けられている2つの記号のイメージを先ず 分離することにより上記試みの第2の試みを達成することを更に特徴とすること を特徴とする請求項30の方法。 32.上記後置処理段階が、 上記第1分離段階が上記文字イメージを首尾良く分離することに失敗したときは 必ず上記文字イメージにおいて互いに接触している2つの記号のイメージを第2 に分離することにより上記試みの第3の試みを達成することを更に特徴とするこ とを特徴とする請求項31の方法。 33.推測処理段階であって、 (1)低得点記号のどれが上記文字イメージの上記元の形の高さに最も近い高さ を有すか、 (2)幾つかの低得点記号の全てが上記文字イメージに高さの点で近い場合、上 記神経網出力において識別された上記低得点記号のどれが上記最高得点記号と上 記神経網によって混同される可能性が大きいかに応じて、最高得点記号の代わり に上記神経網の出力において識別された上記幾つかの低得点記号の1つを選択す ることを特徴とする推測処理段階を更に特徴とする請求項32の方法。 34.上記試みの第1の試みを達成する段階が、上記神経網出力において識別さ れた最高得点記号がその正常化された文字イメージが上記記号の上及び下ケース 形に対して同一である記号である時は必ず上記元の文字イメージから上記文字イ メージのケースを識別することを特徴とすることを特徴とする請求項31の方法 。 35.上記分割段階が、上記書類イメージにおいて「オン」画素を度数分布し「 オン」画素が欠けているその中の画素の行及び列に沿って上記書類イメージを分 割することを更に特徴とし、及び 上記第1分離段階が上記文字イメージに対して接続成分分析を達成することを特 徴とする ことを特徴とする請求項31の方法。 36.上記第2分離段階が、一連の文字分離試行プロセスを所定の順序で達成す ることを特徴とし、上記試行プロセスの各々が上記試行プロセスの次のプロセス において不在であると仮定された対応する組の可能な接触記号対を探索すること を含むことを特徴とする請求項32の方法。 37.上記一連の試行プロセスが、 (1)2つの隣接記号の底部において、上記文字イメージを分離することを試み ること、 (2)隣接記号から左手円弧を有する記号を分離することを試みること、(3) 隣接記号から頂部水平ラインを有する記号を分離することを試みること、(4) 2つの隣接記号の頂部において上記文字イメージを分離することを試みること、 (5)その頂部及びその底部の両方において上記文字イメージを分離することを 試みること、 (6)隣接記号から互いに反対に傾斜している対角線を含む記号を分離すること を試みること、 (7)隣接する円弧を有する一対の記号を分離することを試みること、(8)隣 接記号から小文字fを分離することを試みること、及び(9)上記の段階(1) 乃至(8)において試みられていない隣接記号を分離することを試みること を特徴とすることを特徴とする請求項35の方法。 38.上記第1及び第2分離段階が各々、上記文字イメージを分離することによ り形成される一対のイメージを正常化し且つ上記神経網入力に転送することを更 に特徴とすることを特徴とする請求項32の方法。 39.上記第2分離段階が、 上記神経網出力に第2パターンを得るべく上記文字イメージを分離することによ り形成された一対のイメージを正常化し且つ上記神経網入力に転送すること、及 び 上記神経網の上記出力における上記第2パターンを単一の既知記号の文字イメー ジを分割する上記一連の試行プロセスの対応するプロセスに典型的な所定の出力 パターンと比較すること を特徴とする誤差検査プロセスを更に含むことを特徴とする請求項36の方法。 40.上記所定出力パターンが上記試行プロセスの対応する1つによって分離さ れる1つの記号の連続イメージを上記神経網入力に転送することにより確立され た1組の所定出力パターンの1つであることを特徴とする請求項39の方法。 41.上記第2分離段階が、1組の既知の一般的誤差パターンと(a)上記文字 イメージに対して上記神経網によって識別される最高得点記号及び(b)上記文 字イメージを分離することにより形成される上記イメージの対に対して上記神経 網によって識別される記号を含むパターンとを比較することを含む一般的検査段 階を更に特徴とすることを特徴とする請求項39の方法。 42.上記組の既知の一般的誤差パターンが既知記号を2つの部分に分割するこ とに相当することを特徴とする請求項41の方法。
JP91504481A 1990-02-02 1991-01-31 機械印刷文字用光学的文字認識神経網システム Pending JPH05506114A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US474,587 1990-02-02
US07/474,587 US5048097A (en) 1990-02-02 1990-02-02 Optical character recognition neural network system for machine-printed characters
PCT/US1991/000651 WO1991011779A1 (en) 1990-02-02 1991-01-31 Optical character recognition neural network system for machine-printed characters

Publications (1)

Publication Number Publication Date
JPH05506114A true JPH05506114A (ja) 1993-09-02

Family

ID=23884184

Family Applications (1)

Application Number Title Priority Date Filing Date
JP91504481A Pending JPH05506114A (ja) 1990-02-02 1991-01-31 機械印刷文字用光学的文字認識神経網システム

Country Status (4)

Country Link
US (1) US5048097A (ja)
EP (1) EP0513188A1 (ja)
JP (1) JPH05506114A (ja)
WO (1) WO1991011779A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9447467B2 (en) 2009-04-21 2016-09-20 Genetic Technologies Limited Methods for obtaining fetal genetic material

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03288285A (ja) * 1990-04-04 1991-12-18 Takayama:Kk データ処理装置の学習方法
JP2760145B2 (ja) * 1990-09-26 1998-05-28 三菱電機株式会社 知識情報処理装置
US5680627A (en) * 1991-02-15 1997-10-21 Texas Instruments Incorporated Method and apparatus for character preprocessing which translates textual description into numeric form for input to a neural network
US5371809A (en) * 1992-03-30 1994-12-06 Desieno; Duane D. Neural network for improved classification of patterns which adds a best performing trial branch node to the network
US5442715A (en) * 1992-04-06 1995-08-15 Eastman Kodak Company Method and apparatus for cursive script recognition
EP0566015A3 (en) * 1992-04-14 1994-07-06 Eastman Kodak Co Neural network optical character recognition system and method for classifying characters in amoving web
JP2723118B2 (ja) * 1992-08-31 1998-03-09 インターナショナル・ビジネス・マシーンズ・コーポレイション 2次元オブジェクトの認識に用いるためのニューラル・ネットワーク及び光学式文字認識装置
US5319722A (en) * 1992-10-01 1994-06-07 Sony Electronics, Inc. Neural network for character recognition of rotated characters
US5742702A (en) * 1992-10-01 1998-04-21 Sony Corporation Neural network for character recognition and verification
US5426684A (en) * 1993-11-15 1995-06-20 Eastman Kodak Company Technique for finding the histogram region of interest for improved tone scale reproduction of digital radiographic images
US5774586A (en) * 1994-05-04 1998-06-30 Ncr Corporation Method and apparatus for standardization of inputs to word recognition systems
US5787194A (en) * 1994-11-08 1998-07-28 International Business Machines Corporation System and method for image processing using segmentation of images and classification and merging of image segments using a cost function
JP3805005B2 (ja) * 1994-11-09 2006-08-02 キヤノン株式会社 画像処理装置及び光学的文字認識装置及びそれらの方法
US5883986A (en) * 1995-06-02 1999-03-16 Xerox Corporation Method and system for automatic transcription correction
US6026177A (en) * 1995-08-29 2000-02-15 The Hong Kong University Of Science & Technology Method for identifying a sequence of alphanumeric characters
JPH0991380A (ja) * 1995-09-21 1997-04-04 Canon Inc 情報処理装置及び方法及び記憶媒体
JP2000506642A (ja) * 1996-02-09 2000-05-30 サーノフ コーポレイション 不確定の訓練データを用いてオブジェクトを検出及び分類するようにニューラルネットワークを訓練する方法及び装置
US6324532B1 (en) 1997-02-07 2001-11-27 Sarnoff Corporation Method and apparatus for training a neural network to detect objects in an image
US6731784B2 (en) * 1999-08-25 2004-05-04 Hewlett-Packard Development Company, L.P. Detection and deterrence of counterfeiting of documents with a seal having characteristic color, size, shape and radial density profile
JP4136951B2 (ja) * 2003-01-31 2008-08-20 株式会社リコー 画像処理装置、プログラム及び記憶媒体
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US8442331B2 (en) 2004-02-15 2013-05-14 Google Inc. Capturing text from rendered documents using supplemental information
US8799303B2 (en) 2004-02-15 2014-08-05 Google Inc. Establishing an interactive environment for rendered documents
US10635723B2 (en) 2004-02-15 2020-04-28 Google Llc Search engines and systems with handheld document data capture devices
US7812860B2 (en) 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US20060041484A1 (en) * 2004-04-01 2006-02-23 King Martin T Methods and systems for initiating application processes by data capture from rendered documents
US9116890B2 (en) 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US8621349B2 (en) 2004-04-01 2013-12-31 Google Inc. Publishing techniques for adding value to a rendered document
US9143638B2 (en) 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
US8793162B2 (en) 2004-04-01 2014-07-29 Google Inc. Adding information or functionality to a rendered document via association with an electronic counterpart
US7894670B2 (en) 2004-04-01 2011-02-22 Exbiblio B.V. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US20070300142A1 (en) 2005-04-01 2007-12-27 King Martin T Contextual dynamic advertising based upon captured rendered text
US9008447B2 (en) 2004-04-01 2015-04-14 Google Inc. Method and system for character recognition
US20080313172A1 (en) 2004-12-03 2008-12-18 King Martin T Determining actions involving captured information and electronic content associated with rendered documents
US8713418B2 (en) 2004-04-12 2014-04-29 Google Inc. Adding value to a rendered document
US8620083B2 (en) * 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US8489624B2 (en) 2004-05-17 2013-07-16 Google, Inc. Processing techniques for text capture from a rendered document
US9460346B2 (en) 2004-04-19 2016-10-04 Google Inc. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US8874504B2 (en) 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US7499588B2 (en) * 2004-05-20 2009-03-03 Microsoft Corporation Low resolution OCR for camera acquired documents
US8346620B2 (en) 2004-07-19 2013-01-01 Google Inc. Automatic modification of web pages
US20110029504A1 (en) * 2004-12-03 2011-02-03 King Martin T Searching and accessing documents on private networks for use with captures from rendered documents
US7765029B2 (en) * 2005-09-13 2010-07-27 Neurosciences Research Foundation, Inc. Hybrid control device
US7657094B2 (en) * 2005-12-29 2010-02-02 Microsoft Corporation Handwriting recognition training and synthesis
US20110096174A1 (en) * 2006-02-28 2011-04-28 King Martin T Accessing resources based on capturing information from a rendered document
US20070250532A1 (en) * 2006-04-21 2007-10-25 Eastman Kodak Company Method for automatically generating a dynamic digital metadata record from digitized hardcopy media
US8229232B2 (en) * 2007-08-24 2012-07-24 CVISION Technologies, Inc. Computer vision-based methods for enhanced JBIG2 and generic bitonal compression
US8218904B2 (en) * 2008-08-27 2012-07-10 Lockheed Martin Corporation Method and system for circular to horizontal transposition of an image
DE102008042080A1 (de) 2008-09-15 2010-03-25 Bundesdruckerei Gmbh Verfahren zur automatischen optischen Zeichenerfassung, Computerprogrammprodukt, Datenverarbeitungssystem und Scanner
CN102349087B (zh) 2009-03-12 2015-05-06 谷歌公司 自动提供与捕获的信息例如实时捕获的信息关联的内容
US8447066B2 (en) 2009-03-12 2013-05-21 Google Inc. Performing actions based on capturing information from rendered documents, such as documents under copyright
US8761511B2 (en) * 2009-09-30 2014-06-24 F. Scott Deaver Preprocessing of grayscale images for optical character recognition
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
JP2012194705A (ja) * 2011-03-15 2012-10-11 Omron Corp 画像処理装置、画像処理方法および画像処理プログラム
US20130117044A1 (en) * 2011-11-05 2013-05-09 James Kalamas System and method for generating a medication inventory
WO2013164849A2 (en) * 2012-04-12 2013-11-07 Tata Consultancy Services Limited A system and method for detection and segmentation of touching characters for ocr
US9286526B1 (en) * 2013-12-09 2016-03-15 Amazon Technologies, Inc. Cohort-based learning from user edits
JP2015215837A (ja) * 2014-05-13 2015-12-03 株式会社デンソー 演算処理装置
US9940551B1 (en) * 2016-06-17 2018-04-10 Google Llc Image generation using neural networks
US11087144B2 (en) * 2018-10-10 2021-08-10 Harman International Industries, Incorporated System and method for determining vehicle data set familiarity
JP7277128B2 (ja) 2018-12-25 2023-05-18 キヤノン株式会社 画像処理システム、画像処理方法、プログラム、画像処理装置、情報処理装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3192505A (en) * 1961-07-14 1965-06-29 Cornell Aeronautical Labor Inc Pattern recognizing apparatus
US3275985A (en) * 1962-06-14 1966-09-27 Gen Dynamics Corp Pattern recognition systems using digital logic
US3275986A (en) * 1962-06-14 1966-09-27 Gen Dynamics Corp Pattern recognition systems
US3267439A (en) * 1963-04-26 1966-08-16 Ibm Pattern recognition and prediction system
JPS5539025B2 (ja) * 1973-07-09 1980-10-08
US4479241A (en) * 1981-08-06 1984-10-23 Buckley Bruce S Self-organizing circuits for automatic pattern recognition and the like and systems embodying the same
US4635290A (en) * 1983-12-20 1987-01-06 Nec Corporation Sectioning apparatus and method for optical character reader systems
JP2607457B2 (ja) * 1984-09-17 1997-05-07 株式会社東芝 パターン認識装置
FR2625347B1 (fr) * 1987-12-23 1990-05-04 Labo Electronique Physique Structure de reseau de neurones et circuit et arrangement de reseaux de neurones
US4876731A (en) * 1988-02-19 1989-10-24 Nynex Corporation Neural network model in pattern recognition using probabilistic contextual information

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9447467B2 (en) 2009-04-21 2016-09-20 Genetic Technologies Limited Methods for obtaining fetal genetic material

Also Published As

Publication number Publication date
WO1991011779A1 (en) 1991-08-08
US5048097A (en) 1991-09-10
EP0513188A1 (en) 1992-11-19

Similar Documents

Publication Publication Date Title
JPH05506114A (ja) 機械印刷文字用光学的文字認識神経網システム
US6021220A (en) System and method for pattern recognition
Farah et al. Classifiers combination and syntax analysis for Arabic literal amount recognition
JPH06309498A (ja) 画像抽出方式
JP2001052116A (ja) パターン列マッチング装置とパターン列マッチング方法と文字列マッチング装置と文字列マッチング方法
Yu et al. Recognizing text in historical maps using maps from multiple time periods
Zhou et al. Discrimination of characters by a multi-stage recognition process
Wang et al. Holistic recognition of handwritten character pairs
Kou et al. Extracting information from text and images for location proteomics
Chen Lexicon-driven word recognition
US10657404B2 (en) Character recognition device, character recognition method, and character recognition program
JP2825072B2 (ja) 文字列認識装置
Renaudin et al. A general method of segmentation-recognition collaboration applied to pairs of touching and overlapping symbols
JP2998054B2 (ja) 文字認識方法及び文字認識装置
JP2001147990A (ja) 画像データ処理装置及び方法並びにこれに利用される記憶媒体
JPH03225579A (ja) 文字パターン切り出し装置
Ensafi et al. Recognition of separate and adjoint Persian letters using primitives
Trenkle et al. Arabic character recognition
JPH07117995B2 (ja) 文字認識装置
KR100453687B1 (ko) 극점간의 매핑을 이용한 온라인 서명인증장치 및 그 방법
JP2974145B2 (ja) 文字認識結果の修正方法
Goularas et al. Optical Music Recognition of the Hamparsum Notation
Suresh Printed and handwritten tamil characters recognition using fuzzy technique
JPH09218921A (ja) 一般文書読取装置
JPH1021325A (ja) 文字認識方法