JPH0714010A - 文字認識方法、変換方法および文字認識装置 - Google Patents

文字認識方法、変換方法および文字認識装置

Info

Publication number
JPH0714010A
JPH0714010A JP5244171A JP24417193A JPH0714010A JP H0714010 A JPH0714010 A JP H0714010A JP 5244171 A JP5244171 A JP 5244171A JP 24417193 A JP24417193 A JP 24417193A JP H0714010 A JPH0714010 A JP H0714010A
Authority
JP
Japan
Prior art keywords
characters
pixel
array
character
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5244171A
Other languages
English (en)
Other versions
JP3301030B2 (ja
Inventor
Toru Oki
亨 大木
Phillip Paorera
フィリップ パオレラ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Electronics Inc
Original Assignee
Sony Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Electronics Inc filed Critical Sony Electronics Inc
Publication of JPH0714010A publication Critical patent/JPH0714010A/ja
Application granted granted Critical
Publication of JP3301030B2 publication Critical patent/JP3301030B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【目的】 文字認識などに使用する円形状に配列された
文字列を直線状に変換する方法を提供する。 【構成】 たとえば、コンパクトディスクの中心穴の周
りに円形状に配列された文字列を直線状の配列する変換
を行う場合、まず、その文字列を走査して、円形状配列
の位置に複数の走査画像点を割りつける。次いで、これ
らの点は直線状配列にマッピングされる。さらに、画像
データの分解能を高めるため、これらの点の数がオリジ
ナル画像の走査点よりも多くなるように選択される。こ
れら分解能を高めた点の位置がアドレスアレイに記憶さ
れる。オリジナル画像におけるピクセルの値が目標アレ
イに複写される。ピクセルの値が2進数の値に変換され
て、その値が文字認識用ニューラルネットワークおよび
検証用ニューラルネットワークに対する入力データとし
て用いられる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は一般的には文字またはシ
ンボルの認識に用いるニューラルネットワークの分野に
関する。より特定的には、本発明は例えば、コンパクト
ディクスの中心の穴のまわりに、または缶または瓶の円
形状の配列において、文字またはシンボルが回転されて
いる状態の文字またはシンボルを認識するための方法お
よびその装置に関する。
【0002】〔関連出願の記述〕本発明に関連する出願
を下記に示す。本発明は、それぞれ同じ日(1992年
10月1日)に米国特許庁に出願され、本願出願と同じ
共通の所有者によって、我が国に出願された下記の出願
に関係している。 (1)米国出願シリアル番号:07/955,563 米国出願名称“Training Method for Neural Network U
sing Width Variation" 発明者:Toru Oki(大木亨) 我が国特許出願整理番号:S93037568 (1)、(2)、(3)を複合して出願 (2)米国出願シリアル番号:07/955,522 米国出願名称“Training Method for Neural Network U
sing Offset Training Characters" 発明者:Toru Oki(大木亨) 我が国特許出願整理番号:S93037568 (1)、(2)、(3)を複合して出願 (3)米国出願シリアル番号:07/955,534 米国出願名称“Neural Network for Character Recogni
tion and Verification" 発明者:Toru Oki(大木 亨) 我が国特許出願整理番号:S93037568 (1)、(2)、(3)を複合して出願 (4)米国出願シリアル番号:07/955,526 米国出願名称“Training Method for Neural Network" 発明者:Toru Oki(大木 亨) 我が国特許出願整理番号:S93037633
【0003】
【従来の技術】文字認識はニューラルネットワークの重
要な用途の一つである。文字認識の用途は、資料におけ
るテキストの認識のために、および、工業的な応用分野
におけるシンボルおよび文字の認識に用いられている。
そのような全ての用途において、文字の認識における最
適な精度が最も重要である。ニューラルネットワークの
性能および訓練に影響を与える種々の因子の扱いについ
ての概要及び背景事項が下記の論文に見い出される。論
文:著者、Patrick K. Simpson、題名、"Foundations o
f Neural Networks"、Artificial Neural Networksから
刊行:Paradigms,Applications and Hardware Implemen
tations, Sanchez-Sinencio、他、編集、IEEE Press,19
92,米国。
【0004】
【発明が解決しようとする課題】従来のニューラルネッ
トワークにおいては、ハードウエア的な処理およびソフ
トウエア処理のいずれにおいても、文字を表すものをニ
ューラルネットワークに提供することによって文字が認
識されている。内部重み関数が用いられ、ニューラルネ
ットワークを訓練するための訓練過程に基づいてその文
字に最も近いものを表す出力が生成される。訓練過程の
品質を向上させることが現在の研究における主体の対象
であり、この向上が現在、ニューラルネットワークが文
字を同定できる精度を決定している。工業的な用途にお
いて、例えばシリアル番号などを表す文字の正しい認識
が生産管理において重要(クリティカル)である。
【0005】いくつかの例においては、認識されるもの
として、シリアル番号、アルファベットまたは数字の文
字、グラフィックのシンボル、バーコード、または他の
文字が円形状な配列において提供されている。この例と
して、シリアル番号を例示すると、このシリアル番号は
コンパクトディクスの中心の穴の周りに共通に発見され
る。そのような文字の正しい読み取りは直線的に配列さ
れた文字を読み取るよりは実質的に、より複雑である。
本発明は、直線的な配列に文字を再配置し、分離し、そ
して文字を中心化する(センタリング)技法を提供する
ことによって、そのような文字の読みを向上することを
探索する。
【0006】本発明の目的は、ほぼ円形状に配列されて
いる文字またはシンボルを読み取る改良した文字またシ
ンボルを認識する方法および装置を提供することにあ
る。本発明の利益は、円形状の構成に配列された文字ま
たはシンボルの認識の精度を向上させるものである。本
発明の特徴は、変換された文字の分解能が回転された文
字をより正確に表すように向上させうることである。本
発明のこれらの目的、利益および特徴、および、他の目
的、利益および特徴が本発明についての下記の記述の考
慮に基づき、当業者が容易に理解しうる。
【0007】
【課題を解決するための手段】本発明は、たとえばコン
パクトディスクの中心穴の周りに円形状に配列された文
字を直線状の配列に変換する方法に関する。複数の点が
円形状の配列における位置に割り付けられる。これらの
点が直線的な配列にマッピングされる。それらの点の数
が元の(オリジナルの)画像のピクセルの数よりも大き
いように選択することができ、それによって変換された
画像の分解能が向上する。点の位置がアドレスアレイに
記憶される。それから、元の画像におけるピクセルの値
が目標(ターゲット)アレイに複写される。それから、
ピクセルの値がバイナリーの値(2進数値)に変換さ
れ、このバイナリーの値は認識用ニューラルネットワー
クに対する入力および検証用ニューラルネットワークに
対する入力として用いられる。
【0008】本発明の観点に基づく文字を認識する方法
は、円形の構成に配列された文字を表す円形状のものを
受入れ、文字について円形的なものを表すものを直線的
な構成に変換し、文字を直線的に表すものを生成し、文
字を直線的に表すものに基づいて文字認識の処理を遂行
する段階を有する。
【0009】円形状に配列された文字を直線状に配列さ
れた文字に変換する本発明の他の方法は、円形状に配列
された複数の文字を構成するピクセルの値をサンプリン
グするための複数のアドレスロケーション(アドレス位
置)を発生し、円形状に配列された文字のピクセルの値
をサンプリングし、該サンプルされた値から直線状に配
列された文字を構成する段階を有する。
【0010】円形状に配列された文字を認識する本発明
に基づく装置は、円形状に配列された文字を構成するピ
クセルの値をサンプリングするための複数のアドレスロ
ケーションを発生する発生器(手段)を有する。サンプ
リング処理器(手段)は円形状に配列された文字につい
てのピクセルの値をサンプリングする。直線的に配列さ
れた文字はサンプリングされた値から構成され、この直
線的に配列された文字を受け入れるニューラルネットワ
ークが文字の認識に用いられる。
【0011】新規であると信じられている本発明の特徴
は、添付した特許請求の範囲に述べられている。しかし
ながら、本発明はそれ自身、構成および動作方法のいず
れについて、他の目的およびその利益とともに、添付し
た図面に関連づけた下記の記述を参照して最良に理解さ
れる。
【0012】
【実施例】図1は中心の穴の周りにシリアル番号が付さ
れたコンパクトディスクの図である。図2は本発明の文
字認識および検証装置の動作を図解したブロックダイア
ログ図である。図3は本発明の文字認識および検証装置
の動作を示すフローチャートである。図4は円形状に配
列された画像から、直線的なアレイのピクセルをマッピ
ングすることを図解する図である。図5は本発明の極座
標(polar)変換を図解する図である。図6はアドレスア
レイおよび目標アレイのマッピング処理を図解する図で
ある。図7は本発明の極座標変換を記述するフローチャ
ートである。図8は文字の分離および中心化処理を図解
する図である。図9は元の画像のピクセルと向上した分
解能を持つピクセルを重ね合わせた状態を示す図であ
る。
【0013】本発明は種々の異なる形態における実施例
として実現できるが、図面に示されそしてここにおいて
詳述した特定的な実施例において記述される。ここに開
示したものは本発明の原理の一例として考慮されるべき
であり、そして本発明は図示し、記述した特定的な実施
例に限定されることが意図されているものではない。こ
の記述のために、技術的な用語、シンボル、および、文
字はたとえば数、文字、グラフィックシンボル、アルフ
ァベット的なシンボルまたはこれに類似したものなどの
認識可能なメンバー(要素)の組の一つの組の一つのメ
ンバーを表すようにそれぞれが意図されているように幾
分、交換可能に用いられる。
【0014】図1を参照すると、工業的な用途について
本発明の例示が開示されている。そのような用途は、た
とえばサブセンブリ、コンピュータディスク、またはコ
ンパクトディスクなどの一部分の上に付されたシリアル
番号を認識するように用いることができる。もちろん、
他の用途についても可能である。この例示においては、
11桁の文字のシリアル番号(20(ゼロ)45682
O(オー)O(オー)@1)が部分10から認識される
べきものと仮定する。ここで、部分10は本発明の好適
な実施例においてはコンパクトディスクである。この好
適な実施例においては、シリアル番号はまた、ディスク
の透明な基板を通して観察され、それによって文字が図
示したように反転されている。もちろんこのことは、こ
の装置において認識に用いるニューラルネットワークは
反転された文字を認識するように訓練されていることを
明確に要求する。
【0015】図2を参照して述べると、この部分10は
ビデオカメラまたは他の走査装置12によって特定的な
位置おいて観察される。部分10がコンパクトディスク
または円形状の配置を有しているこの場合には、シリア
ル番号がディスクの中心の穴の周りに円形状に配列され
る。このことは文字認識を一層困難にする。ビデオカメ
ラ12の出力は極座標変換器(polar converter)14に
よって解析され、それにより、文字の配置が、中心の穴
の周りに円形状に配列されたものから直線的な順序の文
字に変換される。この直線的な文字の順序は、お互いに
分離され、中心化されるが、これについての詳細は後で
述べる。それから、この直線的な文字の順序が、各々の
文字を表すマトリクス14(またはマトリクスの集合)
として表される。代表的には、このマトリクスはピクセ
ルの値を表す2進数の表記として構成され、これらのピ
クセルの値はこの出願と関連する上述した他の出願にお
いて記述されているように、観察するべき文字を表すも
のである。それゆえ、各々のピクセルは1また0のいず
れかであるが、本発明はこのことは限定されるものでは
ない。なぜならば、アナログの値もまた適切に設計され
たニューラルネットワークに入力として提供されるから
である。本発明においては、初めピクセルの値はアナロ
グの値を用いるが、それから2進数の値、0または1に
ついて言及する。
【0016】マトリクス14は、多少とも従来のニュー
ラルネットワーク20に対する入力として用いられる。
この従来のニューラルネットワーク20は、所定の文字
またはシンボル組から複数の文字またはシンボルを認識
するように訓練されている。(そのような所定の文字ま
たはシンボルの組としては、たとえば、アルファベット
および0〜9までの数字、これに加えて@、*、#など
の選択されたシンボルである)。もし文字がニューラル
ネットワーク20によって正しく認識される場合には、
正しいシリアル番号が入力される。
【0017】例示として示したように、ニューラルネッ
トワーク20から出力されるシリアル番号は11桁の文
字のコードである。勿論一般には、任意の数の文字につ
いて処理できる。この例示においてシリアル番号を検証
するために、ニューラルネットワーク30(301 ・・
・30N )が、シリアル番号の各々の文字に対応して選
択される。そのようなニューラルネットワークのそれぞ
れはマトリスス161...16N を有しており、これ
らのそれぞれのマトリクスは、上記した関連出願におい
て記述したように、解析に用いる。
【0018】これらのニューラルネットワーク30のそ
れぞれは、ニューラルネットワーク20より実質的な構
成が複雑ではなく、各々が文字またはシンボルの組の単
一のメンバーの認識するように訓練されている。従っ
て、各々のニューラルネットワーク30は、単に、
(1)単一の文字、(2)そのような文字でないものを
認識するように訓練されている。それゆえ、ニューラル
ネットワーク30b は、解析されている文字が文字
「b」であるかどうかに対する答えとして、「イエス」
または「ノー」という答えを与えるように訓練されてい
る。そのようにして、ニューラルネットワークは、もし
入力が文字「b」についての画像である場合に「b」が
正しい答えであり、もし「a」、「c」〜「z」、また
は「0」〜「9」の何れかについての画像である場合に
「not b」が正しい答えであるように教示されてい
る。
【0019】図3を参照して述べると、本発明の認識お
よび検証過程がフローチャートの形態で要約されてお
り、ステップ50から開始する。ステップ52におい
て、シリアル番号が部分10から走査され、それによ
り、コンピュータまたはニューラルネットワーク回路に
よって利用可能な画像として表されるものが生成され
る。コンパクトディスクについての実施例について考え
ると、シリアル番号がコンパクトディスクの中心の穴の
周りに半円形に配列されている。ステップ54におい
て、上記画像が、各々の文字を回転させることによって
半円形に配列された文字の配置から直線状の配置に変換
され、この変換によって、より容易に読みやすい配置に
変更し直し、そして下記に述べるようにそれぞれのシン
ボルに区分けされる。
【0020】ステップ58において、マトリクスが組み
合わされて回転した(極座標(polar)を変換した)文字
を含むものとなる。一般的には、さらなる処理のために
記述されるべき技法を用いて、この時点におけるそれぞ
れの文字を分離されたマトリクスのピクセルに分離する
ことが望まれる。このマトリクスは、ステップ62にお
いて、ニューラルネットワークに印加されるが、このニ
ューラルネットワークはN個の文字またシンボルの適切
な組のメンバーを認識するように訓練されているもので
ある。ニューラルネットワークはそれから、ステップ6
6において、シリアル番号についてのN個の文字または
シンボルのそれぞれの値についてニューラルネットワー
クの最良の推定を含む結果を発生させる。
【0021】ステップ72において、シリアル番号につ
いて各々認識されたシンボルに関するものについてのM
個のより少ないニューラルネットワークの一つの組が、
N個のそのようなニューラルネットワークの集合から選
択される。N個のニューラルネットワークの各々が、全
体の文字の組におけるN個の文字の単一のものについて
の認識に関して、「イエス」また「ノー」の答えのみを
与えるように訓練されている。それゆえ、N個のニュー
ラルネットワークの各々はこの組における単一の文字に
ついての認識と関連している。
【0022】ステップ76において、シリアル番号にお
ける文字と関連する個々のマトリクスの各々が、ステッ
プ76において選択されたM個のニューラルネットワー
クの一つと関連し、それにより、シリアル番号のそれぞ
れの文字についてのピクセルのマトリクスによって表さ
れたものとしての文字の画像が、ステップ66から認識
されたそれぞれの文字を関連する認識用ニューラルネッ
トワークに印加される。それから、より少ないM個のニ
ューラルネットワークの各々が、それぞれの文字を解析
し、ステップ82において、それぞれの文字が正しく認
識されたものとして信頼されるべきものか否かを表す結
果を提供する。もしステップ84において、シリアル番
号について全部でM個の文字が正しく認識された場合
は、ステップ86において、この処理は終了する。ステ
ップ84において、もし全ての文字が検証されない場合
は、ステップ86における終了に先立って、ステップ8
8において、エラー修復処理が行われる。
【0023】図5に関連付けて図解されている図4を参
照して述べると、この図4には、文字を直線的な配列に
回転するステップ54における極座標変換処理が詳細に
図解されている。そのような変換を行う方法としては7
つの方法が存在する。第1のものは、好適な分解能の向
上がないベーシック・マッピング機能である。図4にお
いて、数字「2」がコンパクトディスクの中心の穴の周
りに極座標配列(polar arrangement)で示されている。
(一般に、ピクセルは後で明確にするように矩形である
が)図4においては、この文字は多くの四角のピクセル
で構成されている。文字を構成するピクセルの方向(向
き)は例えば、ビデオカメラによって生成されたような
直線的なアレイに配列されたピクセルについての大きな
格子(グリッド)100の部分であることに留意された
い。シリアル番号についての方向は、このピクセルの配
置によって表されるものについて最適なものについては
必要ではない。シリアル番号の文字が画像について比較
的小さい部分を構成している場合には、このことは特別
な場合ともいえる。それゆえ、文字は、部分10および
ビデオカメラ12についての相対的な位置に対して指向
されているピクセルによって幾分大きく表されている。
ピクセルの方向性による文字の貧弱な整列(アライメン
ト)は、ほぼ45度回転させることによって(図4)、
容易に視認できるようになるのであって、それにより、
数字「2」が水平方向のテキストに一層近く方向づけら
れる。この位置において、ピクセルがダイアモンドのよ
うに見える。
【0024】本発明の目的は、対象とする画像について
円形状の配列ではなく、むしろこのピクセルの配列をピ
クセル104の矩形の配列にマッピングすることにあ
る。格子100におけるピクセルの方向が、ピクセル1
04の目標とする配置においてピクセルのその方向から
回転されているから、マップされた文字について相当の
スキューと歪が存在する。マッピング処理およびその結
果として生ずる歪を理解するために、交差状の線と同心
円によって構成されている極座標構成に配置されたピク
セルについてイマジナリー極座標格子を視覚的に判るよ
うにすることが有益である。ピクセルについてのそれぞ
れの放射状のカラムの中心ラインが放射状の線(ラジア
ルライン)106に沿ってドットとして表されている。
図4についてさらなる混乱を回避するため、この図面に
は実際のイマジナリー格子は示されていない。(分解能
を向上するイマジナリー格子の小さな部分が図9に示さ
れている。この格子はコンパクトディスクの中心の周り
に複数の同心円の円弧を発生させることによって構成さ
れるものであり、その同心円の円弧は複数のドットと放
射状の線(ラジアル方向の線)の付加的な組との間の点
で交差し、上記放射状の線は図示したそれらの間におい
て中心の位置から延びている。)これらのドットはサン
プリング点として観察される。オリジナルな円形状の画
像がこれらの点においてサンプリングされ、そのサンプ
リング値が目標(ターゲット)アレイ104に対応する
位置(ロケーション)に複写される。オリジナル画像に
おける各々のピクセルがこのサンプリングの(x,y)
位置に対応するアドレスに割り付けられ、その点が目標
アレイ104にマップされる。
【0025】マッピング処理において、放射状の線(ラ
ジアル方向の線)に沿ったドットのそれぞれの中心が目
標アレイ104におけるピクセルの値にマップされる。
各々のドットの位置を試験し、そしてその結果として生
じた目標アレイ104におけるピクセルを試験すること
によって、歪の原因が理解される。その理由は、オリジ
ナルの画像におけるピクセルの値が、イマジナリー極座
標格子の中心を表すことがオリジナル画像における与え
られたピクセルの範囲内にあるとき、目標アレイ104
におけるピクセルの値としてのみマッピングされている
からである。最大量の歪は、文字が水平方向また垂直方
向から約45度だけ中心にあるとき、および文字がほぼ
垂直方向またはほぼ水平方向よりも比較的少ない方向に
あるときに起こる可能性が高いことが理解されるであろ
う。その歪は、ビデオカメラによって生成された全体の
画像の小さい部分によってのみ構成されている文字に依
存して大きくなる。それゆえ、アレイ100を構成して
いる少ないピクセルは単に、各々の文字を形成してい
る。目標アレイについて新しい回転した文字がそれゆ
え、オリジナル画像とは異なった方向におけるピクセル
で構成される。
【0026】画像における各々のピクセルのためのある
ドット(サンプリング点)を生成するために、放射状の
線(ラジアル方向の線)はピクセルのアスペクト比につ
いてあるピクセルの倍数(times)だけ間隔付けて離され
るべきである。このテストについての実施例において
は、ピクセルは矩形であり、アスペクト比は1.27で
ある。それゆえ、それぞれの放射状の線は、円がピクセ
ル内に測定される場合(分解能の向上が図られないと仮
定した場合)、1.27ピクセルだけ間隔付けられてい
る。このことは、ピクセルの間隔、つまり、放射状の線
が、ピクセルについてのアスペクト比に依存して円の周
りに僅かに変化していることを意味することに留意され
たい。
【0027】Δθは角度インクリメント(増加分)であ
り、この角度インクリメントは極座標変換処理の期間に
現在の角度についての連続的な計算に用いる。例えば極
座標変換計算に用いる第1の角度は単に最初の角度であ
る。ラジアル方向についての計算が開始の角度に沿って
行われた後、新しい角度が開始の角度にΔθだけ加えら
れる。再びラジアル方向の計算がこの角度に沿って行わ
れ、そして現在の角度にΔθを加えることによって更新
される。このように、この計算ループに用いられる現在
の角度はつねに、開始の角度にΔθを整数倍した値を加
えたものとなる。
【0028】Δθの計算は、小さい角度の近似(sin
(z)はほぼ小さい角度に関してzに等しい)に従って
おり、そしてピクセルの矩形の形状について計数するこ
とに用いられる(このテストの実施例において用いられ
るハードウエアのために、1.27である)ピクセルA
のアスペクト比によって調整される。(このハードウエ
アのためのピクセルは、y方向について1単位の高さ、
そしてx方向について1.27単位の大きさを持つもの
として規定されている。)このテスト実施例のハードウ
エアのために変換されている円弧の中心に対する半径は
220のyピクセルであり、これらのピクセルは220
/1.27=173.283のxピクセルに等しい。Δ
θはx方向の1ピクセルの円弧の長さによって決定され
た角度である。したがってこれは、水平方向にマップさ
れる円弧に沿ったピクセル、および垂直方向にマップ化
される半径方向に沿ったピクセルである。それゆえ、ラ
ジアル方向のピクセルは1単位内に、またはy方向の寸
法のピクセル内に測定されうる。Δθがほぼsin(Δ
θ)に等しく、sin(Δθ)が半径によって分割され
た円弧の長さほぼ等しいから、下記式が成立する。
【0029】
【数1】
【0030】あるいは、下記式が得られる。
【0031】
【数2】
【0032】測定について選択された単位がy方向につ
いて1ピクセルの高さであり、半径に沿った全てのピク
セルが目標領域の連続する列にマップされるから、半径
に沿った点の間の間隔は、単に1単位である。
【0033】一旦角度と範囲が決定されると、アレイが
極座標変換の期間に生成されたアドレスを維持するため
に準備される。このことは図6にアドレスアレイとして
図解されている。例えば、その範囲が45度である場
合、ただし、この範囲は(452 pi(π)r)/3
60、または、136のx方向のピクセルに対応してお
り、なおここで、r=220/1.27=173.22
8のy方向のピクセルである、アドレスアレイにおける
カラム数は136である。もし円弧の幅が32のy方向
ピクセルの場合には、列のアドレスアレイにおける列
(rows) の数は32である。アドレスアレイの内容は、
極座標変換の期間に計算されたアドレスである。
【0034】一旦これらのアドレスが記憶されると、ピ
クセルの値が検索できるオリジナル画像の位置が決定さ
れる。それゆえ、座標変換処理の次の段階は、アドレス
アレイにおけるアドレスのための対応するピクセルの位
置を単に探し、図6に図解したように、目標アレイにそ
のピクセルの値を複写することである。この図において
対象とするピクセルは、位置(481,90)に配置さ
れている。このアドレスが、目標アレイにおけるそのピ
クセルと関連しているその位置におけるアドレスアレイ
に記憶される。それから、アドレスアレイにおける各々
の位置について、ピクセルの値がオリジナル画像(また
はオリジナル画像を表すものを含むコンピュータファイ
ル)から目標アレイに複写される。この複写は単にアド
レスと関連する値を探すことによって行われる。
【0035】アドレスアレイに記憶される極座標アドレ
スを計算するために、まず、xアドレスおよびyアドレ
スが計算され、そしてアドレスアレイに記憶される。そ
れから、スクリーンの中心のアドレスがオフセットとし
て因子化(factored) される。このことは、その点のx
プロジェクションにスクリーン中心を加え、そしてその
スクリーン中心からyプロジェクションを減ずることに
よって行われる(その理由は、座標の原点がスクリーン
の左上の隅にあると考慮されているからである)。xピ
クセルの寸法がアスペクト比(このテスト実施例のおい
ては1.27)によって分割されており、yピクセルの
寸法がy方向の計算に用いられることを想定している。
【0036】このテスト実施例において、回転された画
像がスクリーンのある領域に複写される。その領域はコ
ンパクトディスクに刻印されたシリアル番号とは干渉し
ない。この例示においては、32ピクセル×136ピク
セルの領域が選択されている。座標変換過程は、アドレ
スアレイから一つの要素を選択し、スクリーンピクセル
のアドレスを入手し、そのピクセルについてグレイスケ
ールの値を目標アレイに複写することを行う。これらの
処理段階はアドレスアレイにアドレスされた各々のピク
セルについて反復して行われる。
【0037】この好適な実施例において、ビデオカメラ
からのピクセルが(グレイスケールとしての表記の方法
である)0〜127の間の値として表されるブライトネ
ス(明るさ)の値として記憶される。本発明の座標変換
処理によって一旦画像が回転させられると、各々のピク
セルの値が所定のしきい値と比較され2進数の値、0ま
たは1を表すものとして最良のものか否かが決定され
る。このテスト実施例においては、しきい値として70
が用いられ、70より大きい値は1の値として割り付け
られ、そして70よりも小さい値は0の値として割り付
けられる。しかしながら、明確なしきい値の値は、画像
の明るさ、ビデオカメラの感度および他のハードウエア
の因子等の種々の要素に依存する値となる。明確なしき
い値の値の決定は、特定的なハードウエアおよび照明状
態によって経験的に決定することが最良である。
【0038】図5に関連付けて見た場合によりよく理解
される図7を参照して述べると、本発明の上述した変換
処理のフローチャートは、ステップ110から開始す
る。ステップ114において、角度θ1 がコンパクトデ
ィスクの上の規準点を検索することによって決定され
る。この検索はまた、手動によってまたは当業者によっ
て行われる他の通常の方法によっても行われうる。この
好適な実施例においては、図1に示したように、シリア
ル番号が小さな四角112に続けられて穴を包囲する円
弧113が設けられ、その後に続くようになっているこ
とが知られている。ステップ118において、変換され
るべき円弧の範囲θx (θω)が任意の適切な方法によ
って決定される。この適用において変換されるべき円弧
の範囲は常に85度として知られている。ステップ12
4において、隣接する放射状の線(ラジアル方向の線)
106を間隔付ける角度Δθが下記式によって計算され
る。
【0039】
【数3】
【0040】ここで、記号Aはピクセルのアスペクト比
であり、記号dは半径である。ステップ130におい
て、角度範囲θx が下記の式を用いて円弧の範囲を構成
する水平方向のピクセルの数に変換される。
【0041】
【数4】
【0042】この用途において、垂直方向のピクセルの
数は変換されている円弧の一定の幅に依存して固定にな
っている。他の用途においては、この値は上述した値と
は異なり、その幅は計算されうる。ステップ136にお
いて、イマジナリー極座標における各々のピクセルの中
心についてのラジアル方向のアドレスが下記式を用いて
x座標およびy座標として計算される。
【0043】
【数5】
【0044】
【数6】
【0045】一旦これらのx座標およびy座標が計算さ
れると、これらは矩形の目標格子におけるそれぞれの位
置に割り付けられる。ステップ142において、オリジ
ナル画像について計算されたx座標およびyの座標にお
ける全てのピクセルの値が目標矩形格子に複写される。
この時点において、ピクセルはその範囲が0〜127で
あるディジタル化されたアナログのブライトネスの形態
になっている。この好適な実施例の2進数入力ニューラ
ルネットワークのために、これらのブライトネスの値
が、ステップ144において、「2進化された」ピクセ
ルに変換される。この2進化されたピクセルはそれらの
値を表す0また1のいずれかを有する。それから、ステ
ップ148において、文字が区分化され、中心化され
る。
【0046】一旦文字が直線状の配列に変換されると、
ステップ148において、それらの文字が区分けされ、
そして中心化される。それらの文字を正しく中心位置に
位置決めすることが認識または検証する精度を向上させ
る。中心化する方法が、図7に図解したように、達成さ
れる。文字「A」を例示して図解したように、この文字
の左および右の縁が、所定のしきい値を越えている、所
定の列またはカラムにおいて照明されているピクセルの
数の増加または減少を検出することにより配置される。
左の縁がx1 で表され、右の縁がx2 として表される。
それから、文字の中心の位置が(x2 −x1 )/2によ
って漸近化される。同様にして、文字の頂部(y2 )お
よび底部(y1 )が配置され、そして文字の中心が(y
2 −y1)/2によって漸近化される。
【0047】このテストの実施例において、文字が図8
に示したxのプロジェクションに基づいて発見されてい
るx1 ,x2 によって中心化される。先ず、x1 の検出
について考える。各々のカラムがそのカラムにおける複
数のピクセルについて左から右に検査される(図8のx
のプロジェククションに留意されたい)。値1を有する
5個のピクセルが一つのカラムに見いだされた時、その
xの値はその文字の内部にあるべきものと考えられる。
それから次のカラムのそれぞれが2ピクセルにまたそれ
より少ないピクセルを有する一つのカラムが見いだされ
るまで、逆の順序で(右から左へ)検査される。この時
点において、xの値はその文字のちょうど左にあるよう
に推定される。それゆえ、右側に対するカラムはその文
字(x1)においける第1のカラムであるべきものと考
えられる。同様の処理が用いられてx2 、y1 、および
2 の値が見いだされる。それから中心の位置が上述し
た式に基づいて計算される。ステップ150において、
この処理が終了する。
【0048】表1は、ある円形状に配列された文字のピ
クセルをある目標とする文字のピクセルに変換するため
に用いられたCコード(言語)のプログラムリスティン
グである。
【0049】
【表1】
【0050】図9に関連づけて図解されている図7に戻
って述べると、分解能を向上させる方法を用いる本発明
の極座標変換処理は、上述した処理と実質的に同一であ
る。分解能を向上させる方法と図7に図解した方法との
差異の違いの唯一のことは、ステップ124およびステ
ップ136である。ステップ124において、Δθの代
わりに、ピクセルについて隣接する放射(ラジアル)方
向のカラム相互間の間隔としてΔθ/2が計算され、そ
れにより放射状の線(ラジアル方向の線)106相互間
の間隔が以前に述べた処理の距離の半分になる。ステッ
プ136において、放射状の線ごとのサンプル点の数が
2倍になっている(あるいは増加されている)。但し、
処理は実質的には同じである。図9は、いかにして分解
能を向上させる方法が1×1.27のラジアル領域のそ
れぞれについて4ピクセルを生成するかを、図解してい
る。
【0051】極座標変換処理の期間、アドレスの期間の
丸め処理および回転されたピクセルによってカバーされ
た領域およびオリジナルのピクセルとの間の矛盾に起因
した分解能の損失が存在する。分解能のいくつかを修復
するためにピクセルについてのサンプリングがより少な
いインクリメントを用いて遂行される。サンプリング点
を多くすると精度は向上するが、演算のオーバーヘッド
が増加する。ラジアル方向および角度方向の両者におけ
るサンプリング点の数を2倍にすることによって適切な
平衡が達成され、それによってオリジナル画像における
各々のピクセルについての目標画像において4個のピク
セルが生成される。このことはΔθを2で割り、そして
ラジアル方向のインクリメントを2で割ることによって
達成された。これにより、丸め誤差が小さくなり目標画
像における精度が向上した。
【0052】図9を参照すると、分解能の向上が図られ
ない場合について斜線で示した1×1.27の領域が目
標ピクセルを示している。このピクセルはその中心点
(481,91)に配置されたピクセルの値であると考
えられるが、ピクセル(481,90)によって表され
た領域と完全に一致するものではない。向上された目標
画像が4つの位置におけるオリジナル画像をサンプリン
グし、それゆえ、その領域におけるピクセルの組み合わ
せ、即ち(481,90)、(481,90)、48
0,90)および(481,91)を表している。
【0053】換言すれば、放射状の線(ラジアル方向の
線)106の長さに沿ったサンプリング点の数が2倍に
なっており(または所定の量だけ増加されており)、そ
して放射状の線106の数もまた2倍になっている(ま
たは所定の数だけ増加されている)。その結果は、円形
状に配列された文字についてのピクセルの値のより大き
なサンプリング点を持っている画像であり、それゆえ、
目標アレイにより4倍ほど多いピクセルを持っている画
像に非常に接近する(例えば、ステアステップ近似法
(stair step approximation: 階段漸近法) による)。
この好適な実施例において、図4に図示した点において
サンプリングすることによって分解能が2倍になってい
る。その理由は、ドットと最も高いドット(または最も
低いドット)の上にある付加的な位置との間の位置に沿
ったラジアル方向の線に沿ってドットがあるからであ
る。そこでまた、図示されたラジアル方向の線に、端部
における付加的な線を加えたそれぞれの間の他のラジア
ル方向の線をサンプリングすることによって、精度が2
倍になる。このことは、元の画像の分解能を4倍にして
いる結果となる。
【0054】一般に、できるだけ多くのサンプリング点
を用いることが最良である。しかしながら、それぞれの
付加的なサンプリング点は、演算に必要な演算能力(co
mputation power)を増大させ、ニューラルネットワーク
の複雑さを1入力ノードだけ増大させ、そして、それに
よる計算を複雑にする。
【0055】表2はこのテストにおける極座標変換を行
うために使用したCコードのプログラムリストである。
【0056】
【表2】
【0057】このリストは、垂直方向の分解能が2倍で
あり、水平方向の分解能が2倍である。これについて
は、表1に示したリストと2つの相違をもたらす。つま
り、「delta−th」を計算するライン、および、
最後の“for“ステートメントのラインである。付加
的な因子2の除算および乗算がそれぞれ加えられて、サ
ンプリング点の数を2倍にしている。
【0058】本発明については種々の変形が可能であ
る。たとえば、この実施例のニューラルネットワークは
コンピュータプログラムの形態でディジタルコンピュー
タにおいて実現されているが、ハードウエア回路あるい
は類似するものによる実現も可能であり、ニューラルネ
ットワーク回路の稼働率(利用率)および価格がより魅
力的になる。
【0059】したがって、本発明によれば、上述した目
的、意図および利益を十分に満足する装置が述べられて
いる。本発明は特定的な実施例に関連づけて記述されて
いるが、種々の変形形態、修正、代替および変形が、上
述した記述に照らし合わせれば、当業者にとって明瞭で
あることは明らかである。したがって、本発明は添付し
た特許請求範囲の記載事項におけるそのような変形形
態、修正および変形を包含するものである。
【0060】
【発明の効果】本発明によれば、直線状に配列された複
数のシリアルが文字あるいはシンボルから直線状の文字
に容易に変換することができる。また本発明によれば、
元の画像以上に分解能を向上させることができる。
【図面の簡単な説明】
【図1】図1は中心の穴の周りにシリアル番号が付され
たコンパクトディスクの図である。
【図2】図2(A)、(B)は本発明の文字認識および
検証装置の動作を図解したブロックダイアログ図であ
る。
【図3】図3は本発明の文字認識および検証装置の動作
を示すフローチャートである。
【図4】図4は円形状に配列された画像から、直線的な
アレイのピクセルをマッピングすることを図解する図で
ある。
【図5】図5(A)、(B)は本発明の極座標変換を図
解する図である。
【図6】図6はアドレスアレイおよび目標アレイのマッ
ピング処理を図解する図である。
【図7】図7は本発明の極座標変換を記述するフローチ
ャートである。
【図8】図8は文字の分離および中心化処理を図解する
図である。
【図9】図9は元の画像のピクセルと、向上した分解能
を持つピクセルを重ね合わせた状態を示す図である。
【符号の説明】
10・・部分 12・・走査装置 14・・極座標変換器 16・・マトリクス 20・・ニューラルネットワーク 30・・ニューラルネットワーク

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】文字を認識する方法であって、該方法が下
    記の諸段階、すなわち、 円形状構成に配列された文字についての円形状に表され
    たものを受け入れ、 前記文字の円形的な状態を直線的な構成に変換して、前
    記文字について直線的に表現されたものを生成し、 前記文字についての直線的に表現されたものに依存して
    文字の認識処理を行う諸段階を具備する文字認識方法。
  2. 【請求項2】前記文字の認識処理を遂行するに先立っ
    て、前記文字についての円形状の配列の配置について、
    分解能を高めて表されるものを発生する段階をさらに具
    備する請求項1記載の方法。
  3. 【請求項3】前記発生段階が前記円形状の配列の垂直方
    向の分解能を2倍にする請求項2記載の方法。
  4. 【請求項4】前記発生段階が前記円形状の配列の水平方
    向の分解能を2倍にする請求項2記載の方法。
  5. 【請求項5】前記発生段階が、 前記円形状の配列に対する複数のサンプリング点を割り
    付け、 前記サンプリング点における前記円形状に表されたもの
    からピクセルの値をアレイに複写する段階を有する請求
    項2記載の方法。
  6. 【請求項6】前記それぞれのピクセルのそれぞれの値に
    依存して前記ピクセルの値のそれぞれを2進数の値、0
    または1に変換する段階をさらに具備する請求項2記載
    の方法。
  7. 【請求項7】前記変換段階が、下記の諸段階、すなわ
    ち、 前記円形状に表されたものにおける、該円形状に表され
    たものを覆っている極座標格子に配列されている複数の
    サンプリング点のそれぞれのアドレスを計算し、 前記サンプル点を矩形のピクセルのアレイにマッピング
    する段階を有する請求項1記載の方法。
  8. 【請求項8】円形状に配列された文字を直線状に配列さ
    れた文字に変換する方法であって、該方法が下記の諸段
    階、すなわち、 前記円形状に配列された文字を構成するピクセルの値を
    サンプリングするための複数のアドレスの位置を発生
    し、 前記円形状に配列された文字についての前記ピクセルの
    値をサンプリングし、 該サンプルされた値から前記直線的に配列された文字を
    構成する諸段階を具備する変換方法。
  9. 【請求項9】円弧と、その周囲に前記円形状に配列され
    た文字が配列されている円の中心点から延びている複数
    の放射状の線との交差によって形成された点の極座標ア
    レイとして配列されている前記アドレス位置、および、
    前記円弧が、前記中心点の周囲に構成されている請求項
    8記載の方法。
  10. 【請求項10】前記サンプリング点の数が、前記円形状
    に配列された文字を形成しているピクセルの数に等しい
    か、または、それより以上である請求項9記載の方法。
  11. 【請求項11】前記複数の放射状の線が垂直方向に1ピ
    クセルの高さだけ間隔づけられている請求項9記載の方
    法。
  12. 【請求項12】前記同心円が水平方向に1ピクセルの幅
    だけ間隔づけられている請求項9記載の方法。
  13. 【請求項13】前記直線的に配列された文字の中心を検
    出する段階をさらに具備する請求項8記載の方法。
  14. 【請求項14】前記直線的に配列された文字の縁を検出
    する段階をさらに具備する請求項8記載の方法。
  15. 【請求項15】前記サンプリング点のアドレスを記憶す
    るアドレスアレイを発生し、該サンプルされたピクセル
    の値を目標アレイに記憶する段階をさらに具備する請求
    項8記載の方法。
  16. 【請求項16】前記サンプリングされたピクセルの値と
    規準の値とを比較し、該比較に基づいて2進数の値を前
    記ピクセルの値に割り付ける段階をさらに具備する請求
    項8記載の方法。
  17. 【請求項17】前記発生させる段階がxおよびyの座標
    としてアドレス位置を計算し、該座標を前記円形状に配
    列された画像における最も近いピクセルのアドレスに丸
    める段階を有する請求項8記載の方法。
  18. 【請求項18】前記直線状に配列された文字をニューラ
    ルネットワークに印加する段階をさらに具備する請求項
    8記載の方法。
  19. 【請求項19】円形状に配列された文字を直線状に配列
    された文字に変換する方法であって、該方法が下記の諸
    段階、すなわち、 前記円形状に配列された文字を構成するピクセルの値を
    サンプリングするための複数のアドレス位置を発生する
    段階であって、該アドレス位置が円弧と放射状の線との
    交差によって形成される位置についての極座標アレイと
    して配列され、該放射状の線がその周囲に円形状に配列
    された文字が配列されている円の中心の位置から延び、
    前記円弧が前記中心位置の周囲に形成されているもの、
    および、前記サンプリング点の数が前記円形状に配列さ
    れている文字を構成するピクセルの数と等しいか、また
    はそれ以上であり、前記放射状の線が垂直方向に1ピク
    セルの整数の除数値(integer divisor )の高さだけ間
    隔付けられており、および前記同心円が水平方向に1ピ
    クセルの整数の除数値の幅だけ間隔付けられているも
    の、 前記サンプリング位置のアドレスを記憶するアドレスア
    レイを発生して、前記サンプルされたピクセルの値を目
    標アレイに記憶し、 前記円形状に配列された文字についての前記ピクセルの
    値をサンプリングし、 該サンプリングされた値から前記直線状に配列された文
    字を構成し、 前記直線状に配列された文字の中心を見いだし、 前記直線状に配列された文字の縁を発見し、 前記サンプリングされたピクセルの値と規準の値とを比
    較し、該比較結果に基づいて2進数の値を前記ピクセル
    の値に割りつけし、 ここで、前記アドレスの位置を発生する段階が、xおよ
    びy座標としてアドレスの位置を計算する段階、およ
    び、該座標を前記円形状に配列された画像において最も
    近いピクセルのアドレスに丸める段階を有し、 前記直線状に配列された文字をニューラルネットワーク
    に印加する諸段階を具備する変換方法。
  20. 【請求項20】円形状に配列された文字を認識する装置
    であって、該装置が、 前記円形状に配列された文字を構成するピクセルの値を
    サンプリングするための複数のアドレスの位置を発生す
    る発生手段と、 前記円形状に配列された文字について前記ピクセルの値
    をサンプリングするサンプリング手段と、 該サンプルされた値から前記直線的に配列された文字を
    構成する構成手段と、 前記直線的に配列された文字を入力し、前記文字を認識
    するニューラルネットワークとを具備する円形状に配列
    された文字を認識する装置。
JP24417193A 1992-10-01 1993-09-30 円形状に配列された文字を直線状に配列された文字に変換する方法および装置、並びに、文字認識方法および装置 Expired - Fee Related JP3301030B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/955,555 US5319722A (en) 1992-10-01 1992-10-01 Neural network for character recognition of rotated characters
US07/955555 1992-10-01

Publications (2)

Publication Number Publication Date
JPH0714010A true JPH0714010A (ja) 1995-01-17
JP3301030B2 JP3301030B2 (ja) 2002-07-15

Family

ID=25496991

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24417193A Expired - Fee Related JP3301030B2 (ja) 1992-10-01 1993-09-30 円形状に配列された文字を直線状に配列された文字に変換する方法および装置、並びに、文字認識方法および装置

Country Status (2)

Country Link
US (1) US5319722A (ja)
JP (1) JP3301030B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5515451A (en) * 1992-01-08 1996-05-07 Fuji Xerox Co., Ltd. Image processing system for selectively reproducing documents
JP2710202B2 (ja) * 1993-03-24 1998-02-10 インターナショナル・ビジネス・マシーンズ・コーポレイション 閉じた輪郭イメージを凸多角形で境界づける方法及びデータ処理装置
US7624277B1 (en) * 2003-02-25 2009-11-24 Microsoft Corporation Content alteration for prevention of unauthorized scripts
US8208725B2 (en) * 2007-06-21 2012-06-26 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
US8144989B2 (en) * 2007-06-21 2012-03-27 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
US8340430B2 (en) * 2007-07-10 2012-12-25 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
US8023770B2 (en) 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for identifying the orientation of a digital image
US8023741B2 (en) * 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for detecting numerals in a digital image
US8160365B2 (en) * 2008-06-30 2012-04-17 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
US8316310B2 (en) * 2008-08-05 2012-11-20 International Business Machines Corporation System and method for human identification proof for use in virtual environments
US8218904B2 (en) * 2008-08-27 2012-07-10 Lockheed Martin Corporation Method and system for circular to horizontal transposition of an image
US9076058B2 (en) 2013-01-29 2015-07-07 Sharp Laboratories Of America, Inc. Methods, systems and apparatus for determining orientation in a document image
US11195172B2 (en) * 2019-07-24 2021-12-07 Capital One Services, Llc Training a neural network model for recognizing handwritten signatures based on different cursive fonts and transformations

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3050711A (en) * 1959-02-26 1962-08-21 Bell Telephone Labor Inc Automatic character analyzer
US3701098A (en) * 1971-06-15 1972-10-24 Scanner Device for machine reading of information without manipulation of the information carrier
JPS5539025B2 (ja) * 1973-07-09 1980-10-08
JPS51118333A (en) * 1975-04-11 1976-10-18 Hitachi Ltd Pattern recognition system
US4267573A (en) * 1978-06-14 1981-05-12 Old Dominion University Research Foundation Image processing system
US4395699A (en) * 1979-09-10 1983-07-26 Environmental Research Institute Of Michigan Method and apparatus for pattern recognition and detection
US4491960A (en) * 1982-04-05 1985-01-01 The United States Of America As Represented By The Secretary Of The Navy Handprinted symbol recognition system
US4922543A (en) * 1984-12-14 1990-05-01 Sten Hugo Nils Ahlbom Image processing device
DE3587582D1 (de) * 1985-03-14 1993-10-21 Beltronics Inc Gerät und Verfahren zum selbsttätigen Inspizieren von Objekten und zum Identifizieren oder Erkennen bekannter und unbekannter Teile davon, einschliesslich Fehler und dergleichen.
JPS62267610A (ja) * 1986-05-16 1987-11-20 Fuji Electric Co Ltd 対象パタ−ンの回転角検出方式
JPH01246678A (ja) * 1988-03-29 1989-10-02 Toshiba Corp パターン認識装置
US4965725B1 (en) * 1988-04-08 1996-05-07 Neuromedical Systems Inc Neural network based automated cytological specimen classification system and method
US5093899A (en) * 1988-09-17 1992-03-03 Sony Corporation Neural network with normalized learning constant for high-speed stable learning
US4933872A (en) * 1988-11-15 1990-06-12 Eastman Kodak Company Method and system for wavefront reconstruction
US5046020A (en) * 1988-12-16 1991-09-03 E. I. Du Pont De Nemours And Company Distributed parallel processing network wherein the connection weights are generated using stiff differential equations
JPH0821065B2 (ja) * 1989-03-13 1996-03-04 シャープ株式会社 文字認識装置
JP2940933B2 (ja) * 1989-05-20 1999-08-25 株式会社リコー パターン認識方式
US5060276A (en) * 1989-05-31 1991-10-22 At&T Bell Laboratories Technique for object orientation detection using a feed-forward neural network
US5067164A (en) * 1989-11-30 1991-11-19 At&T Bell Laboratories Hierarchical constrained automatic learning neural network for character recognition
US5048097A (en) * 1990-02-02 1991-09-10 Eastman Kodak Company Optical character recognition neural network system for machine-printed characters
US5054094A (en) * 1990-05-07 1991-10-01 Eastman Kodak Company Rotationally impervious feature extraction for optical character recognition
US5052043A (en) * 1990-05-07 1991-09-24 Eastman Kodak Company Neural network with back propagation controlled through an output confidence measure
US5161204A (en) * 1990-06-04 1992-11-03 Neuristics, Inc. Apparatus for generating a feature matrix based on normalized out-class and in-class variation matrices
US5091965A (en) * 1990-07-16 1992-02-25 Sony Corporation Video image processing apparatus
US5157738A (en) * 1990-12-18 1992-10-20 Trustees Of Boston University Rapid category learning and recognition system
US5105468A (en) * 1991-04-03 1992-04-14 At&T Bell Laboratories Time delay neural network for printed and cursive handwritten character recognition
US5214746A (en) * 1991-06-17 1993-05-25 Orincon Corporation Method and apparatus for training a neural network using evolutionary programming

Also Published As

Publication number Publication date
JP3301030B2 (ja) 2002-07-15
US5319722A (en) 1994-06-07

Similar Documents

Publication Publication Date Title
JPH0714010A (ja) 文字認識方法、変換方法および文字認識装置
US20190034717A1 (en) Data entry from series of images of a patterned document
JP3841321B2 (ja) 画像レジストレーション方法
Nakano et al. An algorithm for the skew normalization of document image
JPH06233118A (ja) 連続階調イメージを生成するためにデスクリーニングの実行と、ハーフ階調イメージの解像度の変更とを実行するための装置と方法
JPH05114046A (ja) 手書き文字における特性傾斜角を正規化する方法および装置
JPH0721319A (ja) 自動アジア言語決定装置
Carter et al. Automatic recognition of printed music
US20100054603A1 (en) Device, method and computer program for detecting characters in an image
JPH06301781A (ja) コンピュータによるパターン認識のためのイメージ変換方法及び装置
KR20220088832A (ko) 인감스캐너를 이용한 인감대사 지원 방법
CN115393875B (zh) 基于MobileNetV3的五线谱识别与简谱转换的方法及系统
JP2710202B2 (ja) 閉じた輪郭イメージを凸多角形で境界づける方法及びデータ処理装置
JPH10164575A (ja) フラクタル画像符号化用のスケーリングファクタ決定方法
Sternberg Cytocomputer real-time pattern recognition
Dalitz et al. Using the Gamera Framework for Building a Lute Tablature Recognition System.
US6983084B2 (en) Method of aligning page images
Antal et al. Automated transcription of historical encrypted manuscripts
US4179684A (en) Graphic conversion system for electronic data processing
McGee et al. The optical scanning of medieval music
JP4079346B2 (ja) 画像位置検出方法
JPH03225579A (ja) 文字パターン切り出し装置
JP4121113B2 (ja) 画像位置検出方法
JP2908451B2 (ja) 走査されたビデオ画像を処理する方法及び装置
JPH10334179A (ja) 楽譜認識装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020319

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080426

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080426

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090426

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090426

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100426

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100426

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110426

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120426

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees