JP3301030B2 - 円形状に配列された文字を直線状に配列された文字に変換する方法および装置、並びに、文字認識方法および装置 - Google Patents

円形状に配列された文字を直線状に配列された文字に変換する方法および装置、並びに、文字認識方法および装置

Info

Publication number
JP3301030B2
JP3301030B2 JP24417193A JP24417193A JP3301030B2 JP 3301030 B2 JP3301030 B2 JP 3301030B2 JP 24417193 A JP24417193 A JP 24417193A JP 24417193 A JP24417193 A JP 24417193A JP 3301030 B2 JP3301030 B2 JP 3301030B2
Authority
JP
Japan
Prior art keywords
image data
character
pixel
characters
dimensional plane
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP24417193A
Other languages
English (en)
Other versions
JPH0714010A (ja
Inventor
亨 大木
フィリップ パオレラ
Original Assignee
ソニー エレクトロニクス インク
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー エレクトロニクス インク filed Critical ソニー エレクトロニクス インク
Publication of JPH0714010A publication Critical patent/JPH0714010A/ja
Application granted granted Critical
Publication of JP3301030B2 publication Critical patent/JP3301030B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Processing (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は一般的には文字またはシ
ンボルの認識に用いるニューラルネットワークの分野に
関する。より特定的には、本発明は例えば、コンパクト
ディクスの中心の穴のまわりに、または缶または瓶の円
形状の配列において、文字またはシンボルが回転されて
いる状態の文字またはシンボルを認識するための文字認
識方法およびその装置、並びに、文字認識方法に適用す
る円形状に配列された文字を直線状に配列された文字に
変換する方法と装置に関する。
【0002】〔関連出願の記述〕本発明に関連する出願
を下記に示す。本発明は、それぞれ同じ日(1992年
10月1日)に米国特許庁に出願され、本願出願と同じ
共通の所有者によって、我が国に出願された下記の出願
に関係している。 (1)米国出願シリアル番号:07/955,563 米国出願名称“Training Method for Neural Network U
sing Width Variation" 発明者:Toru Oki(大木亨) 我が国特許出願整理番号:S93037568 (1)、(2)、(3)を複合して出願 (2)米国出願シリアル番号:07/955,522 米国出願名称“Training Method for Neural Network U
sing Offset Training Characters" 発明者:Toru Oki(大木亨) 我が国特許出願整理番号:S93037568 (1)、(2)、(3)を複合して出願 (3)米国出願シリアル番号:07/955,534 米国出願名称“Neural Network for Character Recogni
tion and Verification" 発明者:Toru Oki(大木 亨) 我が国特許出願整理番号:S93037568 (1)、(2)、(3)を複合して出願 (4)米国出願シリアル番号:07/955,526 米国出願名称“Training Method for Neural Network" 発明者:Toru Oki(大木 亨) 我が国特許出願整理番号:S93037633
【0003】
【従来の技術】文字認識はニューラルネットワークの重
要な用途の一つである。文字認識の用途は、資料におけ
るテキストの認識のために、および、工業的な応用分野
におけるシンボルおよび文字の認識に用いられている。
そのような全ての用途において、文字の認識における最
適な精度が最も重要である。ニューラルネットワークの
性能および訓練に影響を与える種々の因子の扱いについ
ての概要及び背景事項が下記の論文に見い出される。論
文:著者、Patrick K. Simpson、題名、"Foundations o
f Neural Networks"、Artificial Neural Networksから
刊行:Paradigms,Applications and Hardware Implemen
tations, Sanchez-Sinencio、他、編集、IEEE Press,19
92,米国。
【0004】
【発明が解決しようとする課題】従来のニューラルネッ
トワークにおいては、ハードウエア的な処理およびソフ
トウエア処理のいずれにおいても、文字を表すものをニ
ューラルネットワークに提供することによって文字が認
識されている。内部重み関数が用いられ、ニューラルネ
ットワークを訓練するための訓練過程に基づいてその文
字に最も近いものを表す出力が生成される。訓練過程の
品質を向上させることが現在の研究における主題であ
り、その向上が現在、ニューラルネットワークが文字を
同定できる精度を決定している。工業的な用途におい
て、例えばシリアル番号などを表す文字の正しい認識が
生産管理において重要(クリティカル)である。
【0005】いくつかの例においては、認識されるもの
として、シリアル番号、アルファベットまたは数字の文
字、グラフィックのシンボル、バーコード、または他の
文字が円形状な配列において提供されている。この例と
して、シリアル番号を例示すると、このシリアル番号は
コンパクトディクスの中心の穴の周りに共通に発見され
る。そのような文字の正しい読み取りは直線的に配列さ
れた文字を読み取るよりは実質的に、より複雑である。
本発明は、直線的な配列に文字を再配置し、分離し、そ
して文字を中心化する(センタリング)技法を提供する
ことによって、そのような文字の読みを向上することを
探索する。
【0006】本発明の目的は、ほぼ円形状に配列されて
いる文字またはシンボルを読み取る改良した文字またシ
ンボルを認識する方法および装置を提供することにあ
る。本発明の利益は、円形状に配列された文字またはシ
ンボルの認識の精度を向上させるものである。本発明の
特徴は、変換された文字の分解能が回転された文字をよ
り正確に表すように向上させうることである。本発明の
これらの目的、利益および特徴、および、他の目的、利
益および特徴が本発明についての下記の記述の考慮に基
づき、当業者が容易に理解しうる。
【0007】
【課題を解決するための手段】本発明の第1の観点によ
れば、円形状に配列された文字を直線状に配列された文
字に変換する方法であって、当該変換方法が下記の諸段
階、すなわち、前記円形状に配列された文字を走査して
直交する水平方向と垂直方向の二次元平面に規定される
複数のピクセルの画像データとして提供する段階と、前
記各ピクセルを縦と横との比率であるアスペクト比に基
づいて前記二次元平面に仮想的に放射状に引く複数の放
射状線の角度変化を算出し、前記走査した画像データの
変換範囲を決定する段階と、前記決定した変換範囲につ
いて、前記二次元平面に仮想的に前記角度変化で複数の
放射状線を仮想的に引き、各放射状線と前記二次元平面
のピクセルと交差するピクセルの位置をアドレス位置と
して、前記交差した部分の画像データを画像データアレ
ーに複写する段階と、前記画像データアレーに複写され
た画像データを各文字に区分する段階とを具備する、円
形状に配列された文字を直線状に配列された文字に変換
する方法が提供される。
【0008】本発明の第2の観点によれば、上記変換方
法を実施する変換装置が提供される。
【0009】本発明の第3の観点によれば、上記変換方
法を用いた文字認識方法が提供される。本発明の文字認
識方法は、円形状に配列された文字を直線状に配列され
た文字に変換し、直線状に配列された各文字を認識可能
なニューラルネットワークを用いて、円形状に配列され
た文字を認識する方法であって、当該認識方法が下記の
諸段階、すなわち、前記円形状に配列された文字を走査
して直交する水平方向と垂直方向の二次元平面に規定さ
れる複数のピクセルの画像データとして提供する段階
と、前記各ピクセルを縦と横との比率であるアスペクト
比に基づいて前記二次元平面に仮想的に放射状に引く複
数の放射状線の角度変化を算出し、前記走査した画像デ
ータの変換範囲を決定する段階と、前記決定した変換範
囲について、前記二次元平面に仮想的に前記角度変化で
複数の放射状線を仮想的に引き、各放射状線と前記二次
元平面のピクセルと交差するピクセルの位置をアドレス
位置として、前記交差した部分の画像データを画像デー
タアレーに複写する段階と、前記画像データアレーに複
写された画像データを各文字に区分する段階と、前記区
分された各文字を前記ニューラルネットワークに印加し
て文字認識を行う段階とを具備する。
【0010】本発明の第4の観点によれば、上記文字認
識方法を実施する文字認識装置が提供される。
【0011】新規であると信じられている本発明の特徴
は、添付した特許請求の範囲に述べられている。しかし
ながら、本発明はそれ自身、構成および動作方法のいず
れについて、他の目的およびその利益とともに、添付し
た図面に関連づけた下記の記述を参照して最良に理解さ
れる。
【0012】
【実施例】図1は中心の穴の周りにシリアル番号が付さ
れたコンパクトディスクの図である。図2は本発明の文
字認識および検証装置の動作を図解したブロックダイア
ログ図である。図3は本発明の文字認識および検証装置
の動作を示すフローチャートである。図4は円形状に配
列された画像から、直線的なアレイのピクセルをマッピ
ングすることを図解する図である。図5は本発明の極座
標(polar)変換を図解する図である。図6はアドレスア
レイおよび目標アレイのマッピング処理を図解する図で
ある。図7は本発明の極座標変換を記述するフローチャ
ートである。図8は文字の分離および中心化処理を図解
する図である。図9は元の画像のピクセルと向上した分
解能を持つピクセルを重ね合わせた状態を示す図であ
る。
【0013】本発明は種々の異なる形態における実施例
として実現できるが、図面に示されそしてここにおいて
詳述した特定的な実施例において記述される。ここに開
示したものは本発明の原理の一例として考慮されるべき
であり、そして本発明は図示し、記述した特定的な実施
例に限定されることが意図されているものではない。こ
の記述のために、技術的な用語、シンボル、および、文
字はたとえば数、文字、グラフィックシンボル、アルフ
ァベット的なシンボルまたはこれに類似したものなどの
認識可能なメンバー(要素)の組の一つの組の一つのメ
ンバーを表すようにそれぞれが意図されているように幾
分、交換可能に用いられる。
【0014】図1を参照すると、工業的な用途について
本発明の例示が開示されている。そのような用途は、た
とえばサブアセンブリ、コンピュータディスク、または
コンパクトディスクなどの一部分の上に付されたシリア
ル番号を認識するように用いることができる。もちろ
ん、他の用途についても可能である。この例示において
は、11桁の文字のシリアル番号(20(ゼロ)456
82O(オー)O(オー)@1)が部品(パーツ)10
から認識されるべきものと仮定する。ここで、部品10
は本発明の好適な実施例においてはコンパクトディスク
である。この好適な実施例においては、シリアル番号は
また、ディスクの透明な基板を通して観察され、それに
よって文字が図示したように反転されている。もちろん
このことは、この装置において認識に用いるニューラル
ネットワークは反転された文字を認識するように訓練さ
れていることを明確に要求する。
【0015】図2を参照して述べると、この部品10は
ビデオカメラまたは他の走査装置12によって特定的な
位置おいて撮像される。部品10がコンパクトディスク
または円形状の配置を有しているこの場合には、シリア
ル番号がディスクの中心の穴の周りに円形状に配列され
る。このことは文字認識を一層困難にする。ビデオカメ
ラ12の出力は極座標変換器(polar converter)14に
よって解析され、それにより、文字の配置が、中心の穴
の周りに円形状に配列されたものから直線的な順序の文
字に変換される。この直線的な文字の順序は、お互いに
分離され、中心化されるが、これについての詳細は後で
述べる。それから、この直線的な文字の順序が、各々の
文字を表すマトリクス14(またはマトリクスの集合)
として表される。代表的には、このマトリクスはピクセ
ルの値を表す2進数の表記として構成され、これらのピ
クセルの値はこの出願と関連する上述した他の出願にお
いて記述されているように、視認するべき文字を表すも
のである。それゆえ、各々のピクセルは1また0のいず
れかであるが、本発明はこのことは限定されるものでは
ない。なぜならば、アナログの値もまた適切に設計され
たニューラルネットワークに入力として提供されるから
である。本発明においては、初めピクセルの値はアナロ
グの値を用いるが、それから2進数の値、0または1に
ついて言及する。
【0016】マトリクス14は、多少とも従来のニュー
ラルネットワーク20に対する入力として用いられる。
この従来のニューラルネットワーク20は、所定の文字
またはシンボル組から複数の文字またはシンボルを認識
するように訓練されている。(そのような所定の文字ま
たはシンボルの組としては、たとえば、アルファベット
および0〜9までの数字、これに加えて@、*、#など
の選択されたシンボルである)。もし文字がニューラル
ネットワーク20によって正しく認識される場合には、
正しいシリアル番号が入力される。
【0017】例示として示したように、ニューラルネッ
トワーク20から出力されるシリアル番号は11桁の文
字のコードである。勿論一般的には、任意の数の文字に
ついて処理できる。この例示においてシリアル番号を検
証するために、ニューラルネットワーク30(301
・・30N )が、シリアル番号の各々の文字に対応して
選択される。そのようなニューラルネットワークのそれ
ぞれはマトリスス161 ...16N を有しており、こ
れらのそれぞれのマトリクスは、上記した関連出願にお
いて記述したように、解析に用いる。
【0018】これらのニューラルネットワーク30のそ
れぞれは、ニューラルネットワーク20より実質的な構
成が複雑ではなく、各々が文字またはシンボルの組の単
一のメンバーの認識するように訓練されている。従っ
て、各々のニューラルネットワーク30は、単に、
(1)単一の文字、(2)そのような文字でないものを
認識するように訓練されている。それゆえ、ニューラル
ネットワーク30b は、解析されている文字が文字
「b」であるかどうかに対する答えとして、「イエス」
または「ノー」という答えを与えるように訓練されてい
る。そのようにして、ニューラルネットワークは、もし
入力が文字「b」についての画像である場合に「b」が
正しい答えであり、もし「a」、「c」〜「z」、また
は「0」〜「9」の何れかについての画像である場合に
「not b」が正しい答えであるように教示されてい
る。
【0019】図3を参照して述べると、本発明の認識お
よび検証過程がフローチャートの形態で要約されてお
り、ステップ50から開始する。ステップ52におい
て、シリアル番号が部品10から走査され、それによ
り、コンピュータまたはニューラルネットワーク回路に
よって利用可能な画像として表されるものが生成され
る。コンパクトディスクについての実施例について考え
ると、シリアル番号がコンパクトディスクの中心の穴の
周りに半円形に配列されている。ステップ54におい
て、上記画像が、各々の文字を回転させることによって
半円形に配列された文字の配置から直線状の配置に変換
され、この変換によって、より容易に読みやすい配置に
変更し直し、そして下記に述べるようにそれぞれのシン
ボルに区分けされる。
【0020】ステップ58において、マトリクスが組み
合わされて回転した(極座標(polar)を変換した)文字
を含むものとなる。一般的には、さらなる処理のために
記述されるべき技法を用いて、この時点におけるそれぞ
れの文字を分離されたマトリクスのピクセルに分離する
ことが望まれる。このマトリクスは、ステップ62にお
いて、ニューラルネットワークに印加されるが、このニ
ューラルネットワークはN個の文字またシンボルの適切
な組のメンバーを認識するように訓練されているもので
ある。ニューラルネットワークはそれから、ステップ6
6において、シリアル番号についてのN個の文字または
シンボルのそれぞれの値についてニューラルネットワー
クの最良の推定を含む結果を発生させる。
【0021】ステップ72において、シリアル番号につ
いて各々認識されたシンボルに関するものについてのM
個のより少ないニューラルネットワークの一つの組が、
N個のそのようなニューラルネットワークの集合から選
択される。N個のニューラルネットワークの各々が、全
体の文字の組におけるN個の文字の単一のものについて
の認識に関して、「イエス」また「ノー」の答えのみを
与えるように訓練されている。それゆえ、N個のニュー
ラルネットワークの各々はこの組における単一の文字に
ついての認識と関連している。
【0022】ステップ76において、シリアル番号にお
ける文字と関連する個々のマトリクスの各々が、ステッ
プ76において選択されたM個のニューラルネットワー
クの一つと関連し、それにより、シリアル番号のそれぞ
れの文字についてのピクセルのマトリクスによって表さ
れたものとしての文字の画像が、ステップ66から認識
されたそれぞれの文字を関連する認識用ニューラルネッ
トワークに印加される。それから、より少ないM個のニ
ューラルネットワークの各々が、それぞれの文字を解析
し、ステップ82において、それぞれの文字が正しく認
識されたものとして信頼されるべきものか否かを表す結
果を提供する。もしステップ84において、シリアル番
号について全部でM個の文字が正しく認識された場合
は、ステップ86において、この処理は終了する。ステ
ップ84において、もし全ての文字が検証されない場合
は、ステップ86における終了に先立って、ステップ8
8において、エラー修復処理が行われる。
【0023】図5に関連付けて図解されている図4を参
照して述べると、この図4には、文字を直線的な配列に
回転するステップ54における極座標変換処理が詳細に
図解されている。そのような変換を行う方法としては7
つの方法が存在する。第1のものは、好適な分解能の向
上がないベーシック・マッピング機能である。図4にお
いて、数字「2」がコンパクトディスクの中心の穴の周
りに極座標配列(polar arrangement)で示されている。
(一般に、ピクセルは後で明確にするように矩形である
が)図4においては、この文字は多くの四角のピクセル
で構成されている。文字を構成する複数のピクセルの方
向(向き)は例えば、ビデオカメラによって生成される
ような直線的なアレイに配列された複数のピクセル
きな格子(グリッド)100の部分であることに留意さ
れたい。シリアル番号の向きは、このピクセルの配置
よる表記のために最適である必要ではない。シリアル番
号の文字が画像の比較的小さい部分を構成している場合
には、このことは特別な場合ともいえる。それゆえ、文
字は、部品10ビデオカメラ12との相対的な位置
基づいて指向されたピクセルによって幾分大きく表され
ている。ピクセルの向きによる文字の貧弱な整列(アラ
イメント)は、ほぼ45度回転させることによって(図
4)、容易に視認できるようになるのであって、それに
より、数字「2」が水平方向のテキストに一層近く方向
づけられる。この位置において、ピクセルがダイアモン
ドのように見える。
【0024】本発明の目的は、この配列のピクセルを、
円形状に配列された対象とする画像よりも矩形配列のピ
クセル104にマッピングすることにある。格子100
におけるピクセルの向きが、目標配列のピクセル104
においてピクセルのその向きから回転されているから、
マップされた文字について相当のスキューと歪が存在す
る。マッピング処理およびその結果として生ずる歪を理
解するために、交差状の線と同心円によって構成されて
いる極座標構成に配置されたピクセルについてイマジナ
リー極座標格子を視覚的に判るようにすることが有益で
ある。ピクセルについてのそれぞれの放射状のカラムの
中心ラインが放射状の線(ラジアルライン)106に沿
ってドットとして表されている。図4についてさらなる
混乱を回避するため、この図面には実際のイマジナリー
格子は示されていない。(分解能を向上するイマジナリ
ー格子の小さな部分が図9に示されている。この格子は
コンパクトディスクの中心の周りに複数の同心円の円弧
を発生させることによって構成されるものであり、その
同心円の円弧は複数のドットと放射状の線(ラジアル方
向の線)の付加的な組との間の点で交差し、上記放射状
の線は図示したそれらの間において中心の位置から延び
ている。)これらのドットはサンプリング点として観察
される。オリジナルな円形状の画像がこれらの点におい
てサンプリングされ、そのサンプリング値が目標(ター
ゲット)アレイ104に対応する位置(ロケーション)
に複写される。オリジナル画像における各々のピクセル
がこのサンプリングの(x,y)位置に対応するアドレ
スに割り付けられ、その点が目標アレイ104にマップ
される。
【0025】マッピング処理において、図4に図解した
放射状の線(ラジアル方向の線)106に沿ったドット
のそれぞれの中心が目標アレイ104におけるピクセル
の値にマップされる。各々のドットの位置を検査し、そ
してその結果として生じた目標アレイ104におけるピ
クセルを検査することによって、歪の原因が理解され
る。その理由は、オリジナルの画像におけるピクセルの
値が、イマジナリー極座標格子の中心を表すことがオリ
ジナル画像における与えられたピクセルの範囲内にある
とき、目標アレイ104におけるピクセルの値としての
みマッピングされているからである。最大量の歪は、文
字が水平方向また垂直方向から約45度だけ中心にある
とき、および文字がほぼ垂直方向またはほぼ水平方向よ
りも比較的少ない方向にあるときに起こる可能性が高い
ことが理解されるであろう。その歪は、ビデオカメラに
よって生成された全体の画像の小さい部分によってのみ
構成されている文字に依存して大きくなる。それゆえ、
アレイ100を構成している少ないピクセルだけで各々
の文字を形成している。目標アレイについて新しい回転
した文字がそれゆえ、オリジナル画像とは異なった方向
におけるピクセルで構成される。
【0026】画像における各々のピクセルのための1つ
ドット(サンプリング点)を生成するために、放射状
の線(ラジアル方向の線)はピクセルのアスペクト比の
クセルの倍数(times)だけ間隔付けて離されるべきで
ある。このテストについての実施例においては、ピクセ
ルは矩形であり、アスペクト比は1.27である。それ
ゆえ、円がピクセル内に測定される場合(分解能の向上
が図られないと仮定した場合)、それぞれの放射状の線
は、1.27ピクセルだけ間隔付けられている。このこ
とは、ピクセルの間隔、つまり、放射状の線が、ピクセ
ルについてのアスペクト比に依存して円の周りに僅かに
変化していることを意味することに留意されたい。
【0027】Δθは角度インクリメント(増加分)であ
り、この角度インクリメントは極座標変換処理の期間に
現在の角度についての連続的な計算に用いる。例えば極
座標変換計算に用いる第1の角度は開始角度のみであ
る。ラジアル方向についての計算が開始角度に沿って行
われた後、新しい角度が開始角度にΔθだけ加えられ
る。再びラジアル方向の計算がこの角度に沿って行わ
れ、そして現在の角度にΔθを加えることによって更新
される。このように、この計算ループに用いられる現在
の角度はつねに、開始角度にΔθを整数倍した値を加え
たものとなる。
【0028】Δθの計算は、小さい角度の近似(sin
(z)はほぼ小さい角度に関してzに等しい、すなわ
ち、sin(z)≒z)に従っており、そしてピクセル
の矩形の形状について計数することに用いられる(この
テストの実施例において用いられるハードウエアのため
に、1.27である)ピクセルAのアスペクト比によっ
て調整される。(このハードウエアのためのピクセル
は、y方向について1単位の高さ、そしてx方向につい
て1.27単位の大きさを持つものとして規定されてい
る。)このテスト実施例のハードウエアのために変換さ
れている円弧の中心に対する半径は220のyピクセル
であり、これらのピクセルは220/1.27=17
3.283のxピクセルに等しい。Δθはx方向の1ピ
クセルの円弧の長さによって決定される角度である。し
たがってこれは、水平方向にマップされる円弧に沿った
ピクセル、および垂直方向にマップ化される半径方向に
沿ったピクセルである。それゆえ、ラジアル方向のピク
セルは1単位内に、またはy方向の寸法のピクセル内に
測定されうる。Δθがほぼsin(Δθ)に等しく、s
in(Δθ)が半径によって分割された円弧の長さほぼ
等しいから、下記式が成立する。
【0029】
【数1】
【0030】あるいは、下記式が得られる。
【0031】
【数2】
【0032】測定について選択された単位がy方向につ
いて1ピクセルの高さであり、半径に沿った全てのピク
セルが目標領域の連続する列にマップされるから、半径
に沿った点の間の間隔は、単に1単位である。
【0033】一旦角度と範囲が決定されると、アレイが
極座標変換の期間に生成されたアドレスを維持するため
に準備される。このことは図6にアドレスアレイとして
図解されている。例えば、その範囲が45度である場
合、ただし、この範囲は(452 pi(π)r)/3
60、または、136のx方向のピクセルに対応して
おり、なおここで、r=220/1.27=173.2
28のy方向のピクセルである、アドレスアレイにお
けるカラム数は136である。もし円弧の幅が32
のy方向ピクセルの場合には、列のアドレスアレイにお
ける列(rows)の数は32である。アドレスアレイの内
容は、極座標変換の期間に計算されたアドレスである。
【0034】一旦これらのアドレスが記憶されると、ピ
クセルの値が検索できるオリジナル画像の位置が決定さ
れる。それゆえ、座標変換処理の次の段階は、アドレス
アレイにおけるアドレスのための対応するピクセルの位
置を簡単に探し、図6に図解したように、目標アレイに
そのピクセルの値を複写することである。この図におい
て対象とするピクセルは、位置(481,90)に配置
されている。このアドレスが、目標アレイにおけるその
ピクセルと関連しているその位置におけるアドレスアレ
イに記憶される。それから、アドレスアレイにおける各
々の位置について、ピクセルの値がオリジナル画像(ま
たはオリジナル画像を表すものを含むコンピュータファ
イル)から目標アレイに複写される。この複写は簡単に
アドレスと関連する値を探すことによって行われる。
【0035】アドレスアレイに記憶される極座標アドレ
スを計算するために、まず、xアドレスおよびyアドレ
スが計算され、そしてアドレスアレイに記憶される。そ
れから、スクリーンの中心のアドレス(図6の例示で
は、中心アドレスは(256,240))がオフセット
として因子化(factored) される。このことは、その点
のxプロジェクションにスクリーン中心位置を加え、そ
してそのスクリーン中心位置からyプロジェクションを
減ずることによって行われる(その理由は、座標の原点
がスクリーンの左上の隅にあると考慮されているからで
ある)。xピクセルの寸法がアスペクト比(このテスト
実施例おいては1.27)によって分割されており、
yピクセルの寸法がy方向の計算に用いられることを想
定している。
【0036】このテスト実施例において、回転された画
像がスクリーンのある領域に複写される。その領域はコ
ンパクトディスクに刻印されたシリアル番号とは干渉し
ない。この例示においては、32ピクセル×136ピク
セルの領域が選択されている。座標変換過程は、アドレ
スアレイから一つの要素を選択し、スクリーンピクセル
のアドレスを入手し、そのピクセルについてグレイスケ
ールの値を目標アレイに複写することを行う。これらの
処理段階はアドレスアレイにアドレスされた各々のピク
セルについて反復して行われる。
【0037】この好適な実施例において、ビデオカメラ
からのピクセルが(グレイスケールとしての表記の方法
である)0〜127の間の値として表されるブライトネ
ス(明るさ)の値として記憶される。本発明の座標変換
処理によって一旦画像が回転させられると、各々のピク
セルの値が所定のしきい値と比較され2進数の値、0ま
たは1を表すものとして最良のものか否かが決定され
る。このテスト実施例においては、しきい値として70
が用いられ、70より大きい値は1の値として割り付け
られ、そして70よりも小さい値は0の値として割り付
けられる。しかしながら、明確なしきい値の値は、画像
の明るさ、ビデオカメラの感度および他のハードウエア
の因子等の種々の要素に依存する値となる。明確なしき
い値の値の決定は、特定的なハードウエアおよび照明状
態によって経験的に決定することが最良である。
【0038】図5に関連付けて見た場合によりよく理解
される図7を参照して述べると、本発明の上述した変換
処理のフローチャートは、ステップ110から開始す
る。ステップ114において、角度θ1 がコンパクトデ
ィスクの上の規準点を検索することによって決定され
る。この検索はまた、手動によってまたは当業者によっ
て行われる他の通常の方法によっても行われうる。この
好適な実施例においては、図1に示したように、シリア
ル番号が小さな四角112に続けられて穴を包囲する円
弧113が設けられ、その後に続くようになっているこ
とが知られている。ステップ118において、変換され
るべき円弧の範囲θx (θω)が任意の適切な方法によ
って決定される。この適用において変換されるべき円弧
の範囲は常に85度として知られている。ステップ12
4において、隣接する放射状の線(ラジアル方向の線)
106を間隔付ける角度Δθが下記式によって計算され
る。
【0039】
【数3】
【0040】ここで、記号Aはピクセルのアスペクト比
であり、記号dは半径である。ステップ130におい
て、角度範囲θx が下記の式を用いて円弧の範囲を構成
する水平方向のピクセルの数に変換される。
【0041】
【数4】
【0042】この用途において、垂直方向のピクセルの
数は変換されている円弧の一定の幅に依存して固定にな
っている。他の用途においては、この値は上述した値と
は異なり、その幅は計算されうる。ステップ136にお
いて、イマジナリー極座標における各々のピクセルの中
心についてのラジアル方向のアドレスが下記式を用いて
x座標およびy座標として計算される。
【0043】
【数5】
【0044】
【数6】
【0045】一旦これらのx座標およびy座標が計算さ
れると、これらは矩形の目標格子におけるそれぞれの位
置に割り付けられる。ステップ142において、オリジ
ナル画像について計算されたx座標およびyの座標にお
ける全てのピクセルの値が目標矩形格子に複写される。
この時点において、ピクセルはその範囲が0〜127で
あるディジタル化されたアナログのブライトネスの形態
(グレースケールの値)になっている。この好適な実施
例の2進数入力ニューラルネットワークのために、これ
らのブライトネスの値が、ステップ144において、
「2進化された」ピクセルに変換される。この2進
化されたピクセルはそれらの値を表す0また1のいずれ
かを有する。それから、ステップ148において、文字
が区分化され、中心化される。
【0046】一旦文字が直線状の配列に変換されると、
ステップ148において、それらの文字が区分けされ、
そして中心化される。それらの文字を正しく中心位置に
位置決めすることが認識または検証する精度を向上させ
る。中心化する方法が、図7に図解したように、達成さ
れる。文字「A」を例示して図解したように、この文字
の左および右の縁が、所定のしきい値を越えている、所
定の列またはカラムにおいて照明されているピクセルの
数の増加または減少を検出することにより配置される。
左の縁がx1 で表され、右の縁がx2 として表される。
それから、文字の中心の位置が(x2 −x1 )/2によ
って漸近化される。同様にして、文字の頂部(y2 )お
よび底部(y1 )が配置され、そして文字の中心が(y
2 −y1)/2によって漸近化される。
【0047】このテストの実施例において、文字が図8
に示したxのプロジェクションに基づいて発見されてい
るx1 ,x2 によって中心化される。先ず、x1 の検出
について考える。各々のカラムがそのカラムにおける複
数のピクセルについて左から右に検査される(図8のx
のプロジェククションに留意されたい)。値1を有する
5個のピクセルが一つのカラムに見いだされた時、その
xの値はその文字の内部にあるべきものと考えられる。
それから次のカラムのそれぞれが2ピクセルにまたそれ
より少ないピクセルを有する一つのカラムが見いだされ
るまで、逆の順序で(右から左へ)検査される。この時
点において、xの値はその文字のちょうど左にあるよう
に推定される。それゆえ、右側に対するカラムはその文
字(x1における第1のカラムであるべきものと考え
られる。同様の処理が用いられてx2 、y1 、およびy
2 の値が見いだされる。それから中心の位置が上述した
式に基づいて計算される。ステップ150において、こ
の処理が終了する。
【0048】表1は、ある円形状に配列された文字のピ
クセルをある目標とする文字のピクセルに変換するため
に用いられたCコード(言語)のプログラムリスティン
グである。
【0049】
【表1】
【0050】図9に関連づけて図解されている図7に戻
って述べると、分解能を向上させる方法を用いる本発明
の極座標変換処理は、上述した処理と実質的に同一であ
る。分解能を向上させる方法と図7に図解した方法との
差異の違いの唯一のことは、ステップ124およびステ
ップ136である。ステップ124において、Δθの代
わりに、ピクセルについて隣接する放射(ラジアル)方
向のカラム相互間の間隔としてΔθ/2が計算され、そ
れにより放射状の線(ラジアル方向の線)106相互間
の間隔が以前に述べた処理の距離の半分になる。ステッ
プ136において、放射状の線ごとのサンプル点の数が
2倍になっている(あるいは増加されている)。但し、
処理は実質的には同じである。図9は、いかにして分解
能を向上させる方法が1×1.27のラジアル領域のそ
れぞれについて4ピクセルを生成するかを、図解してい
る。
【0051】極座標変換処理の期間、アドレス位置の丸
め処理および回転されたピクセルによってカバーされた
領域およびオリジナルのピクセルとの間の矛盾に起因
分解能の損失が存在する。分解能のいくつかを修復す
るためにピクセルについてのサンプリングがより少ない
インクリメントを用いて遂行される。サンプリング点を
多くすると精度は向上するが、演算のオーバーヘッドが
増加する。ラジアル方向および角度方向の両者における
サンプリング点の数を2倍にすることによって適切な平
衡が達成され、それによってオリジナル画像における各
々のピクセルについての目標画像において4個のピクセ
ルが生成される。このことはΔθを2で割り、そしてラ
ジアル方向のインクリメントを2で割ることによって達
成された。これにより、アドレス位置の丸め誤差が小さ
くなり目標画像における精度が向上した。
【0052】図9を参照すると、分解能の向上が図られ
ない場合について斜線で示した1×1.27の領域が目
標ピクセルを示している。このピクセルはその中心点
(481,90)に配置されたピクセルの値であると考
えられるが、ピクセル(481,90)によって表され
た領域と完全に一致するものではない。向上された目標
画像が4つの位置におけるオリジナル画像をサンプリン
グし、それゆえ、その領域におけるピクセルの組み合わ
せ、即ち(481,90)、(480,90)、48
,90)および(481,91)を表している。
【0053】換言すれば、図4に図解した放射状の線
(ラジアル方向の線)106の長さに沿ったサンプリン
グ点の数が2倍になっており(または所定の量だけ増加
されており)、そして放射状の線106の数もまた2倍
になっている(または所定の数だけ増加されている)。
その結果は、円形状に配列された文字についてのピクセ
ルの値のより大きなサンプリング点を持っている画像で
あり、それゆえ、目標アレイにより4倍ほど多いピクセ
ルを持っている画像に非常に接近する(例えば、ステア
ステップ近似法(stair step approximation: 階段漸近
法) による)。この好適な実施例において、図4に図示
した点におけるサンプリングより分解能が2倍になって
いる。その理由は、ドットと最も高い位置のドットの
上にある(または最も低いドットの下にある)付加的
点との間のに沿ったラジアル方向の線に沿ってドット
があるからである。そこでまた、図示されたラジアル方
向の線に、端部付加的な線を加えたそれぞれの間の他
のラジアル方向の線をサンプリングすることによって、
分解能が2倍になる。このことは、元の画像の分解能を
4倍にしている結果となる。
【0054】換言すれば、図4に図解した放射状の線
(ラジアル方向の線)106の長さに沿ったサンプリン
グ点の数が2倍になっており(または所定の量だけ増加
されており)、そして放射状の線106の数もまた2倍
になっている(または所定の数だけ増加されている)。
その結果は、円形状に配列された文字についてのピクセ
ルの値のより大きなサンプリング点を持っている画像で
あり、それゆえ、目標アレイにより4倍ほど多いピクセ
ルを持っている画像に非常に接近する(例えば、ステア
ステップ近似法(stair step approximation: 階段漸近
法) による)。この好適な実施例において、図4に図示
した点においてサンプリングすることによって分解能が
2倍になっている。その理由は、ドットと最も高いドッ
ト(または最も低いドット)の上にある付加的な位置と
の間の位置に沿ったラジアル方向の線に沿ってドットが
あるからである。そこでまた、図示されたラジアル方向
の線に、端部における付加的な線を加えたそれぞれの間
の他のラジアル方向の線をサンプリングすることによっ
て、精度が2倍になる。このことは、元の画像の分解能
を4倍にしている結果となる。
【0055】表2はこのテストにおける極座標変換を行
うために使用したCコードのプログラムリストである。
【0056】
【表2】
【0057】このリストは、垂直方向の分解能が2倍で
あり、水平方向の分解能が2倍である。これについて
は、表1に示したリストと2つの相違をもたらす。つま
り、「delta−th」を計算するライン、および、
最後の“for“ステートメントのラインである。付加
的な因子2の除算および乗算がそれぞれ加えられて、サ
ンプリング点の数を2倍にしている。
【0058】本発明については種々の変形が可能であ
る。たとえば、この実施例のニューラルネットワークは
コンピュータプログラムの形態でディジタルコンピュー
タにおいて実現されているが、ハードウエア回路あるい
は類似するものによる実現も可能であり、ニューラルネ
ットワーク回路の稼働率(利用率)および価格がより魅
力的になる。
【0059】したがって、本発明によれば、上述した目
的、意図および利益を十分に満足する装置が述べられて
いる。本発明は特定的な実施例に関連づけて記述されて
いるが、種々の変形形態、修正、代替および変形が、上
述した記述に照らし合わせれば、当業者にとって明瞭で
あることは明らかである。したがって、本発明は添付し
た特許請求範囲の記載事項におけるそのような変形形
態、修正および変形を包含するものである。
【0060】
【発明の効果】本発明によれば、円形状に配列された複
数のシリアル文字あるいはシンボルから直線状の文字
に容易に変換することができる。また本発明によれば、
元の画像以上に分解能を向上させることができる。
【図面の簡単な説明】
【図1】図1は中心の穴の周りにシリアル番号が付され
たコンパクトディスクの図である。
【図2】図2(A)、(B)は本発明の文字認識および
検証装置の動作を図解したブロックダイアログ図であ
る。
【図3】図3は本発明の文字認識および検証装置の動作
を示すフローチャートである。
【図4】図4は円形状に配列された画像から、直線的な
アレイのピクセルをマッピングすることを図解する図で
ある。
【図5】図5(A)、(B)は本発明の極座標変換を図
解する図である。
【図6】図6はアドレスアレイおよび目標アレイのマッ
ピング処理を図解する図である。
【図7】図7は本発明の極座標変換を記述するフローチ
ャートである。
【図8】図8は文字の分離および中心化処理を図解する
図である。
【図9】図9は元の画像のピクセルと、向上した分解能
を持つピクセルを重ね合わせた状態を示す図である。
【符号の説明】
10・・部品 12・・走査装置 14・・極座標変換器 16・・マトリクス 20・・ニューラルネットワーク 30・・ニューラルネットワーク
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平4−113487(JP,A) 特開 平4−244956(JP,A) 特開 平3−38789(JP,A) 実開 昭62−23356(JP,U) (58)調査した分野(Int.Cl.7,DB名) G06K 9/32 - 9/66 G06N 3/00 560 G06T 3/00 100 JICSTファイル(JOIS)

Claims (16)

    (57)【特許請求の範囲】
  1. 【請求項1】円形状に配列された文字を直線状に配列さ
    れた文字に変換する方法であって、当該変換方法が下記
    の諸段階、すなわち、 前記円形状に配列された文字を走査して直交する水平方
    向と垂直方向の二次元平面に規定される複数のピクセル
    の画像データとして提供する段階と、 前記各ピクセルを縦と横との比率であるアスペクト比に
    基づいて前記二次元平面に仮想的に放射状に引く複数の
    放射状線の角度変化を算出し、前記走査した画像データ
    の変換範囲を決定する段階と、 前記決定した変換範囲について、前記二次元平面に仮想
    的に前記角度変化で複数の放射状線を仮想的に引き、各
    放射状線と前記二次元平面のピクセルと交差するピクセ
    ルの位置をアドレス位置として、前記交差した部分の画
    像データを画像データアレーに複写する段階と、 前記画像データアレーに複写された画像データを各文字
    に区分する段階とを具備する、 円形状に配列された文字を直線状に配列された文字に変
    換する方法。
  2. 【請求項2】前記画像データアレーに複写される画像デ
    ータは2値化された画像データである、 請求項1記載の変換方法。
  3. 【請求項3】前記区分化段階において、各文字画像デー
    タについて縦方向の中心位置および横方向の中心位置を
    算出し、中心位置に位置調整する、 請求項1または2記載の変換方法。
  4. 【請求項4】前記角度変化を1/n(nは2以上の整
    数)に細分化し、前記各ピクセルを1/m(mは2以上
    の整数)に細分化して、前記画像データアレーのアドレ
    スをn×mに拡大して、上記複写処理を行う、 請求項1〜3いずれか記載の記載の変換方法。
  5. 【請求項5】円形状に配列された文字を直線状に配列さ
    れた文字に変換し、直線状に配列された各文字を認識可
    能なニューラルネットワークを用いて、円形状に配列さ
    れた文字を認識する方法であって、当該認識方法が下記
    の諸段階、すなわち、 前記円形状に配列された文字を走査して直交する水平方
    向と垂直方向の二次元平面に規定される複数のピクセル
    の画像データとして提供する段階と、 前記各ピクセルを縦と横との比率であるアスペクト比に
    基づいて前記二次元平面に仮想的に放射状に引く複数の
    放射状線の角度変化を算出し、前記走査した画像データ
    の変換範囲を決定する段階と、 前記決定した変換範囲について、前記二次元平面に仮想
    的に前記角度変化で複数の放射状線を仮想的に引き、各
    放射状線と前記二次元平面のピクセルと交差するピクセ
    ルの位置をアドレス位置として、前記交差した部分の画
    像データを画像データアレーに複写する段階と、 前記画像データアレーに複写された画像データを各文字
    に区分する段階と、 前記区分された各文字を前記ニューラルネットワークに
    印加して文字認識を行う段階とを具備する、 文字認識方法。
  6. 【請求項6】前記画像データアレーに複写される画像デ
    ータは2値化された画像データである、 請求項5記載の文字認識方法。
  7. 【請求項7】前記区分化段階において、各文字画像デー
    タについて縦方向の中心位置および横方向の中心位置を
    算出し、中心位置に位置調整する、 請求項5または6記載の文字認識方法。
  8. 【請求項8】前記角度変化を1/n(nは2以上の整
    数)に細分化し、前記各ピクセルを1/m(mは2以上
    の整数)に細分化して、前記画像データアレーのアドレ
    スをn×mに拡大して、上記複写処理を行う、 請求項5〜7いずれか記載の記載の文字認識方法。
  9. 【請求項9】円形状に配列された文字を直線状に配列さ
    れた文字に変換する装置であって、 前記円形状に配列された文字を走査して直交する水平方
    向と垂直方向の二次元平面に規定される複数のピクセル
    の画像データとして提供する手段と、 前記各ピクセルを縦と横との比率であるアスペクト比に
    基づいて前記二次元平面に仮想的に放射状に引く複数の
    放射状線の角度変化を算出し、前記走査した画像データ
    の変換範囲を決定する手段と、 前記決定した変換範囲について、前記二次元平面に仮想
    的に前記角度変化で複数の放射状線を仮想的に引き、各
    放射状線と前記二次元平面のピクセルと交差するピクセ
    ルの位置をアドレス位置として、前記交差した部分の画
    像データを画像データアレーに複写する手段と、 前記画像データアレーに複写された画像データを各文字
    に区分する手段とを具備する、 円形状に配列された文字を直線状に配列された文字に変
    換する装置。
  10. 【請求項10】前記画像データアレーに複写される画像
    データは2値化された画像データである、 請求項9記載の変換装置。
  11. 【請求項11】前記区分化段階において、各文字画像デ
    ータについて縦方向の中心位置および横方向の中心位置
    を算出し、中心位置に位置調整する、 請求項9または10記載の変換装置。
  12. 【請求項12】前記角度変化を1/n(nは2以上の整
    数)に細分化し、前記各ピクセルを1/m(mは2以上
    の整数)に細分化して、前記画像データアレーのアドレ
    スをn×mに拡大して、上記複写処理を行う、 請求項9〜11いずれか記載の記載の変換装置。
  13. 【請求項13】円形状に配列された文字を直線状に配列
    された文字に変換し、直線状に配列された各文字を認識
    可能なニューラルネットワークを用いて、円形状に配列
    された文字を認識する装置であって、 前記円形状に配列された文字を走査して直交する水平方
    向と垂直方向の二次元平面に規定される複数のピクセル
    の画像データとして提供する手段と、 前記各ピクセルを縦と横との比率であるアスペクト比に
    基づいて前記二次元平面に仮想的に放射状に引く複数の
    放射状線の角度変化を算出し、前記走査した画像データ
    の変換範囲を決定する手段と、 前記決定した変換範囲について、前記二次元平面に仮想
    的に前記角度変化で複数の放射状線を仮想的に引き、各
    放射状線と前記二次元平面のピクセルと交差するピクセ
    ルの位置をアドレス位置として、前記交差した部分の画
    像データを画像データアレーに複写する手段と、 前記画像データアレーに複写された画像データを各文字
    に区分する手段と、 前記区分された各文字を前記ニューラルネットワークに
    印加して文字認識を行う手段とを具備する、 文字認識装置。
  14. 【請求項14】前記画像データアレーに複写される画像
    データは2値化された画像データである、 請求項13記載の文字認識装置。
  15. 【請求項15】前記区分化段階において、各文字画像デ
    ータについて縦方向の中心位置および横方向の中心位置
    を算出し、中心位置に位置調整する、 請求項13または14記載の文字認識装置。
  16. 【請求項16】前記角度変化を1/n(nは2以上の整
    数)に細分化し、前記各ピクセルを1/m(mは2以上
    の整数)に細分化して、前記画像データアレーのアドレ
    スをn×mに拡大して、上記複写処理を行う、 請求項13〜15いずれか記載の記載の文字認識装置。
JP24417193A 1992-10-01 1993-09-30 円形状に配列された文字を直線状に配列された文字に変換する方法および装置、並びに、文字認識方法および装置 Expired - Fee Related JP3301030B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/955555 1992-10-01
US07/955,555 US5319722A (en) 1992-10-01 1992-10-01 Neural network for character recognition of rotated characters

Publications (2)

Publication Number Publication Date
JPH0714010A JPH0714010A (ja) 1995-01-17
JP3301030B2 true JP3301030B2 (ja) 2002-07-15

Family

ID=25496991

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24417193A Expired - Fee Related JP3301030B2 (ja) 1992-10-01 1993-09-30 円形状に配列された文字を直線状に配列された文字に変換する方法および装置、並びに、文字認識方法および装置

Country Status (2)

Country Link
US (1) US5319722A (ja)
JP (1) JP3301030B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5515451A (en) * 1992-01-08 1996-05-07 Fuji Xerox Co., Ltd. Image processing system for selectively reproducing documents
JP2710202B2 (ja) * 1993-03-24 1998-02-10 インターナショナル・ビジネス・マシーンズ・コーポレイション 閉じた輪郭イメージを凸多角形で境界づける方法及びデータ処理装置
US7624277B1 (en) * 2003-02-25 2009-11-24 Microsoft Corporation Content alteration for prevention of unauthorized scripts
US8208725B2 (en) * 2007-06-21 2012-06-26 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
US8144989B2 (en) * 2007-06-21 2012-03-27 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
US8340430B2 (en) * 2007-07-10 2012-12-25 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
US8023741B2 (en) 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for detecting numerals in a digital image
US8023770B2 (en) * 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for identifying the orientation of a digital image
US8160365B2 (en) * 2008-06-30 2012-04-17 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
US8316310B2 (en) 2008-08-05 2012-11-20 International Business Machines Corporation System and method for human identification proof for use in virtual environments
US8218904B2 (en) * 2008-08-27 2012-07-10 Lockheed Martin Corporation Method and system for circular to horizontal transposition of an image
US9076058B2 (en) 2013-01-29 2015-07-07 Sharp Laboratories Of America, Inc. Methods, systems and apparatus for determining orientation in a document image
US11195172B2 (en) * 2019-07-24 2021-12-07 Capital One Services, Llc Training a neural network model for recognizing handwritten signatures based on different cursive fonts and transformations

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3050711A (en) * 1959-02-26 1962-08-21 Bell Telephone Labor Inc Automatic character analyzer
US3701098A (en) * 1971-06-15 1972-10-24 Scanner Device for machine reading of information without manipulation of the information carrier
JPS5539025B2 (ja) * 1973-07-09 1980-10-08
JPS51118333A (en) * 1975-04-11 1976-10-18 Hitachi Ltd Pattern recognition system
US4267573A (en) * 1978-06-14 1981-05-12 Old Dominion University Research Foundation Image processing system
US4395699A (en) * 1979-09-10 1983-07-26 Environmental Research Institute Of Michigan Method and apparatus for pattern recognition and detection
US4491960A (en) * 1982-04-05 1985-01-01 The United States Of America As Represented By The Secretary Of The Navy Handprinted symbol recognition system
EP0233888B1 (en) * 1984-12-14 1990-12-12 AHLBOM, Sten Hugo Nils Image processing device
DE3587582D1 (de) * 1985-03-14 1993-10-21 Beltronics Inc Gerät und Verfahren zum selbsttätigen Inspizieren von Objekten und zum Identifizieren oder Erkennen bekannter und unbekannter Teile davon, einschliesslich Fehler und dergleichen.
JPS62267610A (ja) * 1986-05-16 1987-11-20 Fuji Electric Co Ltd 対象パタ−ンの回転角検出方式
JPH01246678A (ja) * 1988-03-29 1989-10-02 Toshiba Corp パターン認識装置
US4965725B1 (en) * 1988-04-08 1996-05-07 Neuromedical Systems Inc Neural network based automated cytological specimen classification system and method
US5093899A (en) * 1988-09-17 1992-03-03 Sony Corporation Neural network with normalized learning constant for high-speed stable learning
US4933872A (en) * 1988-11-15 1990-06-12 Eastman Kodak Company Method and system for wavefront reconstruction
US5046020A (en) * 1988-12-16 1991-09-03 E. I. Du Pont De Nemours And Company Distributed parallel processing network wherein the connection weights are generated using stiff differential equations
JPH0821065B2 (ja) * 1989-03-13 1996-03-04 シャープ株式会社 文字認識装置
JP2940933B2 (ja) * 1989-05-20 1999-08-25 株式会社リコー パターン認識方式
US5060276A (en) * 1989-05-31 1991-10-22 At&T Bell Laboratories Technique for object orientation detection using a feed-forward neural network
US5067164A (en) * 1989-11-30 1991-11-19 At&T Bell Laboratories Hierarchical constrained automatic learning neural network for character recognition
US5048097A (en) * 1990-02-02 1991-09-10 Eastman Kodak Company Optical character recognition neural network system for machine-printed characters
US5052043A (en) * 1990-05-07 1991-09-24 Eastman Kodak Company Neural network with back propagation controlled through an output confidence measure
US5054094A (en) * 1990-05-07 1991-10-01 Eastman Kodak Company Rotationally impervious feature extraction for optical character recognition
US5161204A (en) * 1990-06-04 1992-11-03 Neuristics, Inc. Apparatus for generating a feature matrix based on normalized out-class and in-class variation matrices
US5091965A (en) * 1990-07-16 1992-02-25 Sony Corporation Video image processing apparatus
US5157738A (en) * 1990-12-18 1992-10-20 Trustees Of Boston University Rapid category learning and recognition system
US5105468A (en) * 1991-04-03 1992-04-14 At&T Bell Laboratories Time delay neural network for printed and cursive handwritten character recognition
US5214746A (en) * 1991-06-17 1993-05-25 Orincon Corporation Method and apparatus for training a neural network using evolutionary programming

Also Published As

Publication number Publication date
US5319722A (en) 1994-06-07
JPH0714010A (ja) 1995-01-17

Similar Documents

Publication Publication Date Title
JP3301030B2 (ja) 円形状に配列された文字を直線状に配列された文字に変換する方法および装置、並びに、文字認識方法および装置
US10699109B2 (en) Data entry from series of images of a patterned document
US6151423A (en) Character recognition with document orientation determination
Nakano et al. An algorithm for the skew normalization of document image
JP4928310B2 (ja) ナンバープレート認識装置、その制御方法、コンピュータプログラム
US6678425B1 (en) Method and apparatus for decoding angular orientation of lattice codes
JP3390000B2 (ja) 画像の分析方法
US20020134838A1 (en) Method and apparatus for spatially registering information using embedded data
JPH0721320A (ja) 自動スクリプト決定装置
JPH0721319A (ja) 自動アジア言語決定装置
US8699794B2 (en) Variable glyph system and method
JPH11219407A (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
US9892114B2 (en) Methods and systems for efficient automated symbol recognition
MX2007010180A (es) Importacion inteligente de informacion de la interfaz de usuario de aplicacion del exterior utilizando inteligencia artificial.
US20020121550A1 (en) Method and apparatus for display of spatially registered information using embedded data
CN1175699A (zh) 光学扫描表单识别及更正方法
US9633256B2 (en) Methods and systems for efficient automated symbol recognition using multiple clusters of symbol patterns
CN109635743A (zh) 一种结合stn模块的文本检测深度学习方法及系统
CN112818852A (zh) 印章校验方法、装置、设备及存储介质
US20100054603A1 (en) Device, method and computer program for detecting characters in an image
JPH06301820A (ja) 光学式文字認識に用いる神経細胞的ネツトワーク・アーキテクチヤ、光学式文字認識方法及び装置
JPH0997310A (ja) 文字入力装置
US6983084B2 (en) Method of aligning page images
Smith Optical scanner characterization methods using bilevel scans
JP4079346B2 (ja) 画像位置検出方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020319

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080426

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080426

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090426

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090426

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100426

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100426

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110426

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120426

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees